機器學習中的時間序列是什麼?
顧名思義,時間序列是指包含特定時間段或時間戳的資料。它包含特定時間段內的觀察結果。此類資料告訴我們變數如何根據各種因素隨時間變化。時間序列分析和預測可用於預測未來某個時間點的資料。
單變數時間序列包含在一段時間內在特定時間點相對於單個變數取的值。多變數時間序列包含在相同週期性時間點相對於多個變數取的值。
時間序列包含以下四個組成部分:
水平
它指的是資料值圍繞其變化的平均值。
趨勢
顧名思義,它描述了資料集中的資料點相對於時間的特定模式(增加、減少、中性等)。
季節性
它描述了時間序列資料的重複性質/迴圈行為。
噪聲
觀察結果中由於外部因素隱含新增的不需要的數值。
有很多關於時間序列的方法可以用來捕獲上述元件。讓我們簡要了解其中的一些:
當提供給定變數前一時間段的實際值時,可以使用簡單的估計技術來預測給定變數的值。這本身並沒有真正使用,而更像是使用複雜技術時的參考點。
自迴歸是一種預測未來時間段值的技巧。它使用歷史資料,即前一時間段的資料。資料可能更適合模型,但自迴歸沒有提供對“季節性”元件的解釋。
ARIMA 代表“自迴歸積分移動平均”。它嘗試將資料點的值預測為歷史/先前資料點的線性函式。這樣,前一時間段存在的誤差就會被納入預測資料中。在現實生活中,資料可能不是平穩的,因此開發了季節性 ARIMA 和分數 ARIMA。
指數平滑是一種技術,其中變數被建模為資料集先前值的指數加權線性函式。這種型別的模型非常適合資料的趨勢和季節性。
LSTM 指的是長短期記憶模型,這是一種迴圈神經網路,用於在存在長期依賴關係時處理時間序列模型。需要大量的訓練資料來收集多變數時間序列資料集中的趨勢。
廣告
資料結構
網路
關係資料庫管理系統
作業系統
Java
iOS
HTML
CSS
Android
Python
C 程式設計
C++
C#
MongoDB
MySQL
Javascript
PHP