降維與降數的區別是什麼?
降維
在降維中,使用資料編碼或轉換來訪問原始資料的簡化或“壓縮”表示。如果原始資料可以從壓縮資料中無損地重建,則資料縮減稱為無失真壓縮。如果重建的資料只是原始資料的近似值,則資料縮減稱為有失真壓縮。
離散小波變換 (DWT) 與離散傅立葉變換 (DFT) 密切相關,後者是一種包含正弦和餘弦的訊號處理技術。通常,DWT 能夠實現更好的有失真壓縮。也就是說,如果為給定資料向量的 DWT 和 DFT 保持相似數量的係數,則 DWT 版本將支援對原始資料的更準確近似。因此,對於等效的近似,DWT 需要比 DFT 更少的空間。
降數
在降數中,透過選擇替代的、更小的資料表示形式來減少資料量。這些技術可以是引數化的或非引數化的。對於引數化方法,可以使用模型來估計資料,這樣只需要儲存資料引數,而不是實際資料,例如對數線性模型。非引數化方法用於儲存資料的簡化表示,包括直方圖、聚類和抽樣。
讓我們看看降維和降數之間的比較。
| 降維 | 降數 |
|---|---|
| 在降維中,應用資料編碼或轉換以獲得原始資料的簡化或壓縮表示。 | 在降數中,透過選擇替代的、更小的資料表示形式來減少資料量。 |
| 在降維中,離散小波變換 (DWT) 是一種線性訊號處理技術,當應用於資料向量 X 時,會將其轉換為數值不同的離散小波係數向量 X’。 這兩個向量長度相同。當將此技術應用於資料縮減時,可以將每個元組視為一個 n 維資料向量,即 X=(x1,x2,…xn) 表示從 n 個數據庫屬性對元組進行的 n 次測量。 | 在降數中,可以使用迴歸和對數線性模型來逼近給定的資料。線上性迴歸中,資料建模為擬合一條直線。 例如,一個隨機變數 y(稱為響應變數)可以建模為另一個隨機變數 x(稱為預測變數)的線性函式,其方程為 y = wx+b,其中假設 y 的方差是恆定的。 |
| 它可用於去除無關和冗餘屬性。 | 它只是將原始資料表示為更小形式的一種技術。 |
| 在這種技術中,可能會丟失一些資料,這是不合適的。 | 在這種方法中,不會丟失資料,但所有資料都以更小的形式表示。 |
廣告
資料結構
網路
關係資料庫管理系統 (RDBMS)
作業系統
Java
iOS
HTML
CSS
Android
Python
C語言程式設計
C++
C#
MongoDB
MySQL
Javascript
PHP