降維與降數的區別是什麼?


降維

在降維中,使用資料編碼或轉換來訪問原始資料的簡化或“壓縮”表示。如果原始資料可以從壓縮資料中無損地重建,則資料縮減稱為無失真壓縮。如果重建的資料只是原始資料的近似值,則資料縮減稱為有失真壓縮。

離散小波變換 (DWT) 與離散傅立葉變換 (DFT) 密切相關,後者是一種包含正弦和餘弦的訊號處理技術。通常,DWT 能夠實現更好的有失真壓縮。也就是說,如果為給定資料向量的 DWT 和 DFT 保持相似數量的係數,則 DWT 版本將支援對原始資料的更準確近似。因此,對於等效的近似,DWT 需要比 DFT 更少的空間。

降數

在降數中,透過選擇替代的、更小的資料表示形式來減少資料量。這些技術可以是引數化的或非引數化的。對於引數化方法,可以使用模型來估計資料,這樣只需要儲存資料引數,而不是實際資料,例如對數線性模型。非引數化方法用於儲存資料的簡化表示,包括直方圖、聚類和抽樣。

讓我們看看降維和降數之間的比較。

降維降數
在降維中,應用資料編碼或轉換以獲得原始資料的簡化或壓縮表示。在降數中,透過選擇替代的、更小的資料表示形式來減少資料量。
在降維中,離散小波變換 (DWT) 是一種線性訊號處理技術,當應用於資料向量 X 時,會將其轉換為數值不同的離散小波係數向量 X’。
這兩個向量長度相同。當將此技術應用於資料縮減時,可以將每個元組視為一個 n 維資料向量,即 X=(x1,x2,…xn) 表示從 n 個數據庫屬性對元組進行的 n 次測量。
在降數中,可以使用迴歸和對數線性模型來逼近給定的資料。線上性迴歸中,資料建模為擬合一條直線。
例如,一個隨機變數 y(稱為響應變數)可以建模為另一個隨機變數 x(稱為預測變數)的線性函式,其方程為 y = wx+b,其中假設 y 的方差是恆定的。
它可用於去除無關和冗餘屬性。它只是將原始資料表示為更小形式的一種技術。
在這種技術中,可能會丟失一些資料,這是不合適的。在這種方法中,不會丟失資料,但所有資料都以更小的形式表示。

更新於:2021年11月19日

709 次瀏覽

開啟您的職業生涯

完成課程獲得認證

開始學習
廣告
© . All rights reserved.