什麼是迴歸分析?


迴歸分析定義了一種監督式機器學習方法,可用於預測任何連續值屬性。迴歸分析幫助企業探索目標變數和預測變數之間的關聯。它是探索資料的重要工具,可用於貨幣預測和時間序列建模。

透過將資料擬合到函式(例如迴歸分析)可以平滑資料。線性迴歸包括找到擬合兩個屬性(或變數)的“最佳”直線,以便可以使用一個屬性來預測另一個屬性。多元線性迴歸是線性迴歸的擴充套件,其中包含兩個以上屬性,並且資料擬合到多維空間。

線上性迴歸中,資料建模為擬合一條直線。例如,隨機變數 y(稱為響應變數)可以建模為另一個隨機變數 x(稱為預測變數)的線性函式,其方程為 y = wx + b,其中 y 的方差被認為是恆定的。

迴歸問題處理基於輸入值計算輸出值。當用於分類時,輸入值來自資料庫,輸出值表示類別。迴歸分析可用於探索分類問題,但也可用於多種應用,例如預測。迴歸分析的基本結構是簡單線性迴歸,它只包含一個預測變數和一個預測值。

迴歸分析可以使用兩種方法進行分類:

  • 劃分 - 資料被劃分為位於類別上的區域。

  • 預測 - 生成公式來預測輸出類別的值。

這些方法用於根據一個或多個預測變數(自變數)預測響應變數(因變數)的值,其中變數為整數。迴歸分析有多種形式,例如線性迴歸、多元迴歸、加權迴歸、多項式迴歸、非引數迴歸和穩健迴歸(穩健技術在誤差不滿足正態性條件或資料包含大量異常值時很有用)。

迴歸分析可以預測某些依賴於自變量表達式的因變數資料集,並且趨勢在一定時期內是可用的。迴歸分析提供了一種很好的預測變數的方法,但存在一些限制和假設,例如變數的獨立性和變數固有的正態分佈。

每個迴歸樹葉節點儲存一個連續值預測,它是覆蓋該葉節點的訓練集的預測屬性的平均成本。相反,在模型樹中,每個葉節點傾向於一個迴歸模型和預測屬性的多元連續方程。當資料不能很好地用簡單的線性模型表示時,迴歸樹和模型樹往往比線性迴歸更有效。

更新於:2022年2月15日

400 次瀏覽

開啟你的職業生涯

透過完成課程獲得認證

開始學習
廣告
© . All rights reserved.