時間序列 - 誤差指標
量化模型的效能以便將其用作反饋和比較非常重要。在本教程中,我們使用了最流行的誤差指標之一:均方根誤差。還有其他各種可用的誤差指標。本章簡要討論了它們。
均方誤差
它是預測值和真實值之間差值的平方的平均值。Sklearn 提供了它作為一個函式。它與真實值和預測值的平方具有相同的單位,並且始終為正。
$$MSE = \frac{1}{n} \displaystyle\sum\limits_{t=1}^n \lgroup y'_{t}\:-y_{t}\rgroup^{2}$$
其中 $y'_{t}$ 是預測值,
$y_{t}$ 是實際值,並且
n 是測試集中值的總數。
從等式中可以清楚地看出,MSE 對較大的誤差或異常值具有更大的懲罰作用。
均方根誤差
它是均方誤差的平方根。它也始終為正,並且在資料的範圍內。
$$RMSE = \sqrt{\frac{1}{n} \displaystyle\sum\limits_{t=1}^n \lgroup y'_{t}-y_{t}\rgroup ^2}$$
其中,$y'_{t}$ 是預測值
$y_{t}$ 是實際值,並且
n 是測試集中值的總數。
它是一次方,因此與 MSE 相比更易於解釋。RMSE 對較大的誤差也具有更大的懲罰作用。我們在教程中使用了 RMSE 指標。
平均絕對誤差
它是預測值和真實值之間絕對差值的平均值。它與預測值和真實值具有相同的單位,並且始終為正。
$$MAE = \frac{1}{n}\displaystyle\sum\limits_{t=1}^{t=n} | y'{t}-y_{t}\lvert$$
其中,$y'_{t}$ 是預測值,
$y_{t}$ 是實際值,並且
n 是測試集中值的總數。
平均百分比誤差
它是預測值和真實值之間絕對差值的平均值的百分比,除以真實值。
$$MAPE = \frac{1}{n}\displaystyle\sum\limits_{t=1}^n\frac{y'_{t}-y_{t}}{y_{t}}*100\: \%$$
其中,$y'_{t}$ 是預測值,
$y_{t}$ 是實際值,n 是測試集中值的總數。
但是,使用此誤差的缺點是正誤差和負誤差可以相互抵消。因此,使用平均絕對百分比誤差。
平均絕對百分比誤差
它是預測值和真實值之間絕對差值的平均值的百分比,除以真實值。
$$MAPE = \frac{1}{n}\displaystyle\sum\limits_{t=1}^n\frac{|y'_{t}-y_{t}\lvert}{y_{t}}*100\: \%$$
其中 $y'_{t}$ 是預測值
$y_{t}$ 是實際值,並且
n 是測試集中值的總數。