如果小波變換後的資料長度與原始資料長度相同,那麼這種技術如何用於資料降維?


其效用在於小波變換後的資料可以被壓縮。透過只儲存小波係數中一小部分主要係數,可以保留資訊的壓縮近似值。例如,可以保留高於某個使用者定義閾值的所有小波係數。其他一些係數設定為0。

由此產生的資料描述非常稀疏,因此如果在小波空間中實現,可以利用資料稀疏性的服務在計算上非常快速。該方法還可以去除噪聲而不會平滑資料的特性,使其也適用於資料清洗。給定一組係數,可以使用DWT的反過程生成原始資料的近似值。

DWT通常與離散傅立葉變換(DFT)相關,DFT是一種包含正弦和餘弦的訊號處理方法。一般來說,DWT可以實現良好的有失真壓縮。如果對給定資料向量的DWT和DFT保留相似數量的係數,則DWT版本將支援對原始記錄更有效的近似。

因此,對於相同的近似值,DWT需要的空間比DFT少。與DFT不同,小波在空間上是完全域性部化的,有助於區域性元素的儲存。只有一個DFT,但有多個DWT族。

有一些著名的小波變換,例如Haar-2、Daubechies-4和Daubechies-6變換。使用離散小波變換的一般過程促進了分層金字塔演算法,該演算法在每次迭代中將記錄減半,從而提高了計算速度。該方法如下:

  • 輸入資料向量的長度L應該是2的冪。可以透過根據需要用零填充資料向量來滿足此條件(L ≥ n)。

  • 每次變換都涉及使用兩個函式。第一個函式使用各種資料平滑方法,包括求和或加權平均。第二個函式實現加權差分,有助於突出資料的細節特徵。

  • 這兩個函式用於X中的資料點對,即所有資料對(x2i,x2i+1)。這將產生兩個長度為L/2的資料集。一般來說,這些分別定義了輸入記錄的平滑或低頻版本及其高頻內容。

  • 這兩個函式遞迴地應用於前面迴圈中獲得的資料集,直到獲得的資料集長度為2。

  • 可以選擇來自後續迭代中獲得的資料集的值作為變換資料的 小波係數。

更新於:2022年2月16日

189 次瀏覽

開啟您的職業生涯

完成課程獲得認證

開始學習
廣告
© . All rights reserved.