如果小波變換後的資料長度與原始資料長度相同，那麼這種技術如何用於資料降維？

資料探勘資料庫資料結構

其效用在於小波變換後的資料可以被壓縮。透過只儲存小波係數中一小部分主要係數，可以保留資訊的壓縮近似值。例如，可以保留高於某個使用者定義閾值的所有小波係數。其他一些係數設定為0。

由此產生的資料描述非常稀疏，因此如果在小波空間中實現，可以利用資料稀疏性的服務在計算上非常快速。該方法還可以去除噪聲而不會平滑資料的特性，使其也適用於資料清洗。給定一組係數，可以使用DWT的反過程生成原始資料的近似值。

DWT通常與離散傅立葉變換(DFT)相關，DFT是一種包含正弦和餘弦的訊號處理方法。一般來說，DWT可以實現良好的有失真壓縮。如果對給定資料向量的DWT和DFT保留相似數量的係數，則DWT版本將支援對原始記錄更有效的近似。

因此，對於相同的近似值，DWT需要的空間比DFT少。與DFT不同，小波在空間上是完全域性部化的，有助於區域性元素的儲存。只有一個DFT，但有多個DWT族。

有一些著名的小波變換，例如Haar-2、Daubechies-4和Daubechies-6變換。使用離散小波變換的一般過程促進了分層金字塔演算法，該演算法在每次迭代中將記錄減半，從而提高了計算速度。該方法如下：

輸入資料向量的長度L應該是2的冪。可以透過根據需要用零填充資料向量來滿足此條件(L ≥ n)。
每次變換都涉及使用兩個函式。第一個函式使用各種資料平滑方法，包括求和或加權平均。第二個函式實現加權差分，有助於突出資料的細節特徵。
這兩個函式用於X中的資料點對，即所有資料對(x_2i,x_2i+1)。這將產生兩個長度為L/2的資料集。一般來說，這些分別定義了輸入記錄的平滑或低頻版本及其高頻內容。
這兩個函式遞迴地應用於前面迴圈中獲得的資料集，直到獲得的資料集長度為2。
可以選擇來自後續迭代中獲得的資料集的值作為變換資料的小波係數。

Ginni

更新於：2022年2月16日

189 次瀏覽

開啟您的職業生涯

完成課程獲得認證

廣告

© . All rights reserved.