降維與降數的區別是什麼？

降維

在降維中，使用資料編碼或轉換來訪問原始資料的簡化或“壓縮”表示。如果原始資料可以從壓縮資料中無損地重建，則資料縮減稱為無失真壓縮。如果重建的資料只是原始資料的近似值，則資料縮減稱為有失真壓縮。

離散小波變換 (DWT) 與離散傅立葉變換 (DFT) 密切相關，後者是一種包含正弦和餘弦的訊號處理技術。通常，DWT 能夠實現更好的有失真壓縮。也就是說，如果為給定資料向量的 DWT 和 DFT 保持相似數量的係數，則 DWT 版本將支援對原始資料的更準確近似。因此，對於等效的近似，DWT 需要比 DFT 更少的空間。

降數

在降數中，透過選擇替代的、更小的資料表示形式來減少資料量。這些技術可以是引數化的或非引數化的。對於引數化方法，可以使用模型來估計資料，這樣只需要儲存資料引數，而不是實際資料，例如對數線性模型。非引數化方法用於儲存資料的簡化表示，包括直方圖、聚類和抽樣。

讓我們看看降維和降數之間的比較。

降維	降數
在降維中，應用資料編碼或轉換以獲得原始資料的簡化或壓縮表示。	在降數中，透過選擇替代的、更小的資料表示形式來減少資料量。
在降維中，離散小波變換 (DWT) 是一種線性訊號處理技術，當應用於資料向量 X 時，會將其轉換為數值不同的離散小波係數向量 X’。這兩個向量長度相同。當將此技術應用於資料縮減時，可以將每個元組視為一個 n 維資料向量，即 X=(x₁,x₂,…x_n) 表示從 n 個數據庫屬性對元組進行的 n 次測量。	在降數中，可以使用迴歸和對數線性模型來逼近給定的資料。線上性迴歸中，資料建模為擬合一條直線。例如，一個隨機變數 y（稱為響應變數）可以建模為另一個隨機變數 x（稱為預測變數）的線性函式，其方程為 y = wx+b，其中假設 y 的方差是恆定的。
它可用於去除無關和冗餘屬性。	它只是將原始資料表示為更小形式的一種技術。
在這種技術中，可能會丟失一些資料，這是不合適的。	在這種方法中，不會丟失資料，但所有資料都以更小的形式表示。

Ginni

更新於：2021年11月19日

709 次瀏覽

開啟您的職業生涯

完成課程獲得認證

開始學習