時間序列 - 誤差指標



量化模型的效能以便將其用作反饋和比較非常重要。在本教程中,我們使用了最流行的誤差指標之一:均方根誤差。還有其他各種可用的誤差指標。本章簡要討論了它們。

均方誤差

它是預測值和真實值之間差值的平方的平均值。Sklearn 提供了它作為一個函式。它與真實值和預測值的平方具有相同的單位,並且始終為正。

$$MSE = \frac{1}{n} \displaystyle\sum\limits_{t=1}^n \lgroup y'_{t}\:-y_{t}\rgroup^{2}$$

其中 $y'_{t}$ 是預測值,

$y_{t}$ 是實際值,並且

n 是測試集中值的總數。

從等式中可以清楚地看出,MSE 對較大的誤差或異常值具有更大的懲罰作用。

均方根誤差

它是均方誤差的平方根。它也始終為正,並且在資料的範圍內。

$$RMSE = \sqrt{\frac{1}{n} \displaystyle\sum\limits_{t=1}^n \lgroup y'_{t}-y_{t}\rgroup ^2}$$

其中,$y'_{t}$ 是預測值

$y_{t}$ 是實際值,並且

n 是測試集中值的總數。

它是一次方,因此與 MSE 相比更易於解釋。RMSE 對較大的誤差也具有更大的懲罰作用。我們在教程中使用了 RMSE 指標。

平均絕對誤差

它是預測值和真實值之間絕對差值的平均值。它與預測值和真實值具有相同的單位,並且始終為正。

$$MAE = \frac{1}{n}\displaystyle\sum\limits_{t=1}^{t=n} | y'{t}-y_{t}\lvert$$

其中,$y'_{t}$ 是預測值,

$y_{t}$ 是實際值,並且

n 是測試集中值的總數。

平均百分比誤差

它是預測值和真實值之間絕對差值的平均值的百分比,除以真實值。

$$MAPE = \frac{1}{n}\displaystyle\sum\limits_{t=1}^n\frac{y'_{t}-y_{t}}{y_{t}}*100\: \%$$

其中,$y'_{t}$ 是預測值,

$y_{t}$ 是實際值,n 是測試集中值的總數。

但是,使用此誤差的缺點是正誤差和負誤差可以相互抵消。因此,使用平均絕對百分比誤差。

平均絕對百分比誤差

它是預測值和真實值之間絕對差值的平均值的百分比,除以真實值。

$$MAPE = \frac{1}{n}\displaystyle\sum\limits_{t=1}^n\frac{|y'_{t}-y_{t}\lvert}{y_{t}}*100\: \%$$

其中 $y'_{t}$ 是預測值

$y_{t}$ 是實際值,並且

n 是測試集中值的總數。

廣告

© . All rights reserved.