什麼是趨勢分析?
趨勢分析定義了從時間序列中提取行為模型的技術,這些技術可能被噪聲部分或完全隱藏。趨勢分析方法通常用於檢測疾病暴發以及疾病出現次數的意外增加或減少,監測疾病趨勢,評估疾病控制方案和政策的有效性,以及評估醫療保健方案和政策的成功等。
可以使用各種技術來檢測專案序列中的趨勢。平滑是一種用於去除時間序列中非系統性行為的方法。平滑通常採取尋找屬性值的移動平均值的形式,給定圍繞特定時間點的時間視窗。
使用所有屬性值的區域性平均值代替在此點找到的特定值。通常使用中值而不是平均值,因為它對異常值不太敏感。平滑可以濾除噪聲和異常值。它可以用來預測未來的值,因為生成的更容易擬合已知函式(線性、對數、指數等)。
檢測時間序列資料中的季節性模式比較困難。一種方法是在均勻分佈的間隔處查詢屬性之間的相關性。例如,可以在每第十二個值(在月度銷售資料中)之間找到相關性。相關專案之間的時間差稱為滯後。
可以生成自相關函式來確定不同滯後間隔處資料值之間的相關性。相關圖以圖形方式顯示幾個滯後值的自相關值。
協方差衡量兩個變數如何一起變化。它可以用作確定兩個時間序列或一個時間序列中季節性趨勢之間關係的基礎。自相關係數 rk衡量時間序列值之間特定距離(滯後 k)的相關性。
自相關已經使用了多種方法。正值表示兩個變數一起增加,而負值表示一個變數增加而另一個變數減少。
接近零的值表示兩個變數之間幾乎沒有相關性。計算相關性的一個典型公式是相關係數 r,有時也稱為皮爾遜 r。
給定兩個時間序列 X 和 Y,其均值分別為 X'和 Y',每個均有 n 個元素,則 r 的公式為
$$\mathrm{\frac{\sum(x_i-X')(y_i-Y')}{\sqrt{\sum(x_i-X)^2(y_i-Y')^2}}}$$
將其應用於在時間序列 X=(x1,x2,…xn) 上找到滯後 k 的相關係數 rk 是直接的。第一個時間序列是 X′=(x1,x2,…xn−k),而第二個時間序列是 X''=(xk+1,xk+1,…xn)。
資料結構
網路
關係資料庫管理系統 (RDBMS)
作業系統
Java
iOS
HTML
CSS
Android
Python
C語言程式設計
C++
C#
MongoDB
MySQL
Javascript
PHP