時間序列 - Python 庫
由於 Python 程式碼易於編寫和理解,並且擁有各種各樣的開源庫,因此在進行機器學習的個人中享有盛譽。以下介紹了我們將在接下來的章節中使用的一些此類開源庫。
NumPy
Numerical Python 是一個用於科學計算的庫。它基於 N 維陣列物件,並提供基本的數學功能,例如大小、形狀、均值、標準差、最小值、最大值,以及一些更復雜的函式,例如線性代數函式和傅立葉變換。隨著我們在這個教程中繼續學習,您將瞭解更多關於這些函式的資訊。
Pandas
這個庫提供了高效且易於使用的數資料結構,例如序列、資料幀和麵板。它增強了 Python 的功能,從簡單的數資料收集和準備到數資料分析。Pandas 和 NumPy 這兩個庫使得對小型到超大型資料集的操作變得非常簡單。要了解更多關於這些函式的資訊,請遵循本教程。
SciPy
Science Python 是一個用於科學和技術計算的庫。它提供了用於最佳化、訊號和影像處理、積分、插值和線性代數的功能。在執行機器學習時,此庫非常方便。隨著我們在這個教程中繼續學習,我們將討論這些功能。
Scikit-learn
這個庫是一個 SciPy 工具包,廣泛用於統計建模、機器學習和深度學習,因為它包含各種可定製的迴歸、分類和聚類模型。它與 NumPy、Pandas 和其他庫配合良好,使其更易於使用。
Statsmodels
與 Scikit-learn 一樣,此庫用於統計資料探索和統計建模。它也與其他 Python 庫配合良好。
Matplotlib
這個庫用於以各種格式(例如線圖、條形圖、熱力圖、散點圖、直方圖等)進行資料視覺化。它包含從繪圖到標記所需的所有與圖形相關的功能。隨著我們在這個教程中繼續學習,我們將討論這些功能。
這些庫對於開始使用任何型別的資料進行機器學習非常重要。
除了上面討論的庫之外,另一個特別重要的處理時間序列的庫是:
Datetime
這個庫及其兩個模組(datetime 和 calendar)提供了讀取、格式化和操作時間所需的所有 datetime 功能。
我們將在接下來的章節中使用這些庫。