時間序列 - 引數校準



介紹

任何統計或機器學習模型都有一些引數,這些引數極大地影響了資料的建模方式。例如,ARIMA 具有 p、d、q 值。這些引數需要確定,以便實際值與建模值之間的誤差最小。引數校準被認為是模型擬閤中最關鍵和最耗時的任務。因此,為我們選擇最優引數非常重要。

引數校準方法

有多種方法可以校準引數。本節將詳細討論其中一些方法。

試錯法

一種常見的模型校準方法是手動校準,您首先視覺化時間序列並直觀地嘗試一些引數值,然後反覆更改這些值,直到獲得足夠好的擬合效果。它需要對我們嘗試的模型有很好的理解。對於 ARIMA 模型,手動校準是在自相關圖(用於“p”引數)、偏自相關圖(用於“q”引數)和 ADF 測試(用於確認時間序列的平穩性並設定“d”引數)的幫助下完成的。我們將在接下來的章節中詳細討論所有這些。

網格搜尋

另一種模型校準方法是網格搜尋,它本質上意味著您嘗試為所有可能的引數組合構建模型,並選擇誤差最小的模型。這很耗時,因此當要校準的引數數量以及它們取值範圍較少時才比較有用,因為這涉及多個巢狀的 for 迴圈。

遺傳演算法

遺傳演算法基於生物學原理,即好的解決方案最終會進化到最“優”的解決方案。它使用突變、交叉和選擇等生物學操作最終達到最優解。

有關更多知識,您可以閱讀其他引數最佳化技術,例如貝葉斯最佳化和群體智慧最佳化。

廣告

© . All rights reserved.