統計學 - 擬合優度



擬合優度檢驗用於檢查樣本資料是否符合總體分佈。總體可能具有正態分佈或威布林分佈。簡單來說,它表示樣本資料正確地代表了我們期望從實際總體中找到的資料。以下檢驗通常由統計學家使用

  • 卡方檢驗

  • Kolmogorov-Smirnov檢驗

  • Anderson-Darling檢驗

  • Shapiro-Wilk檢驗

卡方檢驗

卡方檢驗是最常用的擬合優度檢驗之一,用於離散分佈(如二項分佈和泊松分佈),而Kolmogorov-Smirnov和Anderson-Darling擬合優度檢驗用於連續分佈。

公式

${ X^2 = \sum {[ \frac{(O_i - E_i)^2}{E_i}]} }$

其中 -

  • ${O_i}$ = 變數第i個水平的觀察值。

  • ${E_i}$ = 變數第i個水平的期望值。

  • ${X^2}$ = 卡方隨機變數。

示例

一家玩具公司生產足球運動員玩具。它聲稱30%的卡片是中場球員,60%是後衛,10%是前鋒。假設隨機抽取100個玩具,其中50個是中場球員,45個是後衛,5個是前鋒。在顯著性水平為0.05的情況下,你能證明公司的說法嗎?

解決方案

確定假設

  • 零假設 $ H_0 $ - 中場球員、後衛和前鋒的比例分別為30%、60%和10%。

  • 備擇假設 $ H_1 $ - 零假設中至少有一個比例是錯誤的。

確定自由度

自由度DF等於分類變數的水平數(k)減1:DF = k - 1。這裡水平數為3。因此

${ DF = k - 1 \\[7pt] \, = 3 -1 = 2 }$

確定卡方檢驗統計量

${ X^2 = \sum {[ \frac{(O_i - E_i)^2}{E_i}]} \\[7pt] \, = [\frac{(50-30)^2}{30}] + [\frac{(45-60)^2}{60}] + [\frac{(5-10)^2}{10}] \\[7pt] \, = \frac{400}{30} + \frac{225}{60} + \frac{25}{10} \\[7pt] \, = 13.33 + 3.75 + 2.50 \\[7pt] \, = 19.58 }$

確定p值

P值是具有2個自由度的卡方統計量$ X^2 $大於19.58的機率。使用卡方分佈計算器查詢$ { P(X^2 \gt 19.58) = 0.0001 } $。

解釋結果

由於P值(0.0001)遠小於顯著性水平(0.05),因此不能接受零假設。因此,公司的說法是無效的。

廣告