統計 - 殘差分析



殘差分析用於透過定義殘差並檢查殘差圖來評估線性迴歸模型的適用性。

殘差

殘差 (e) 指的是觀察值 (y) 與預測值 (ŷ) 之間的差異。每個資料點都有一個殘差。

殘差 = 觀察值 - 預測值
e = y - ŷ

殘差圖

殘差圖是一個圖表,其中殘差位於垂直軸上,自變數位於水平軸上。如果點隨機分散在水平軸周圍,則線性迴歸模型適用於資料;否則,選擇非線性模型。

殘差圖的型別

以下示例顯示了殘差圖中的一些模式。

Residual Plots

在第一種情況下,點隨機分散。因此,首選線性迴歸模型。在第二種和第三種情況下,點是非隨機分散的,這表明首選非線性迴歸方法。

示例

問題陳述

檢查線性迴歸模型是否適用於以下資料。

x60 70 80 85 95
y(實際值)70 65 70 95 85
ŷ(預測值)65.411 71.849 78.288 81.507 87.945

解決方案

步驟 1:計算每個資料點的殘差。

x60 70 80 85 95
y(實際值)70 65 70 95 85
ŷ(預測值)65.411 71.849 78.288 81.507 87.945
e(殘差)4.589 -6.849 -8.288 13.493 -2.945

步驟 2:繪製殘差圖。

Residual Plot

步驟 3:檢查殘差的隨機性。

此處的殘差圖顯示出隨機模式——第一個殘差為正,接下來的兩個為負,第四個為正,最後一個殘差為負。由於模式相當隨機,這表明線性迴歸模型適用於上述資料。

廣告