資料探勘中的迴歸型別有哪些?


迴歸定義了一種監督機器學習方法的型別,可用於預測任何連續值屬性。迴歸為一些商業組織提供了探索目標變數和預測變數關聯的機會。它是探索資料的重要工具,可用於貨幣預測和時間序列建模。

迴歸的型別多種多樣,如下所示:

線性迴歸 - 線性迴歸包括找到兩個屬性(或變數)的“最佳”擬合線,以便可以使用一個屬性來預測另一個屬性。多元線性迴歸是線性迴歸的擴充套件,其中包含兩個以上屬性,並且資料點擬合到多維空間。

例如,方程為

Y = a + b*X + e.

其中,

a 定義截距

b 定義迴歸線的斜率

e 定義誤差

X 和 Y 分別定義預測變數和目標變數。如果 X 由多個變數組成,則定義為多元線性方程。

線上性迴歸中,最佳擬合線是使用最小二乘法實現的,它減少了每個資料點到迴歸線的偏差平方和的總和。因此,正偏差和負偏差不會相互抵消,因為一些偏差是平方後的。

多項式迴歸 - 如果迴歸方程中自變數的冪大於 1,則定義為多項式方程。

例如,方程為

Y = a + b * x2

在特定迴歸中,最佳擬合線不視為直線(如線性方程);但它定義了一條擬合某些資料點的曲線。

邏輯迴歸 - 當因變數本質上是二元的,例如 0 和 1、真或假、成功或失敗時,邏輯迴歸方法就會出現。因此,目標值 (Y) 的範圍從 0 到 1,通常用於基於分類的問題。與線性迴歸不同,它不需要自變數和因變數之間存線上性關係。

嶺迴歸 - 嶺迴歸定義了一種可用於計算具有多重共線性問題的各種迴歸資料的過程。多重共線性是指兩個或多個自變數之間存線上性相關關係。

Lasso 迴歸 - LASSO 代表最小絕對收縮和選擇運算元。Lasso 迴歸是一種使用收縮的線性迴歸方法。在 Lasso 迴歸中,一些資料點會收縮到一箇中心點,也稱為均值。Lasso 過程最適合引數數量比其他迴歸多的簡單且稀疏的模型。這種迴歸方法非常適合處理存在多重共線性的模型。

更新於: 2022 年 2 月 15 日

2K+ 瀏覽量

開啟您的 職業生涯

透過完成課程獲得認證

開始學習
廣告