
- 統計學教程
- 主頁
- 調整後的R平方
- 方差分析
- 算術平均數
- 算術中位數
- 算術眾數
- 算術極差
- 條形圖
- 最佳點估計
- Beta分佈
- 二項分佈
- Black-Scholes模型
- 箱線圖
- 中心極限定理
- 切比雪夫定理
- 卡方分佈
- 卡方表
- 迴圈排列
- 整群抽樣
- Cohen's kappa係數
- 組合
- 有放回組合
- 比較圖表
- 連續均勻分佈
- 連續數列算術平均數
- 連續數列算術中位數
- 連續數列算術眾數
- 累積頻率
- 變異係數
- 相關係數
- 累積圖
- 累積泊松分佈
- 資料收集
- 資料收集 - 問卷設計
- 資料收集 - 觀察
- 資料收集 - 案例研究方法
- 資料模式
- 十分位數統計
- 離散數列算術平均數
- 離散數列算術中位數
- 離散數列算術眾數
- 點圖
- 指數分佈
- F分佈
- F檢驗表
- 階乘
- 頻數分佈
- 伽馬分佈
- 幾何平均數
- 幾何機率分佈
- 擬合優度
- 總平均數
- Gumbel分佈
- 調和平均數
- 調和數
- 諧振頻率
- 直方圖
- 超幾何分佈
- 假設檢驗
- 個體數列算術平均數
- 個體數列算術中位數
- 個體數列算術眾數
- 區間估計
- 逆伽馬分佈
- Kolmogorov Smirnov檢驗
- 峰度
- 拉普拉斯分佈
- 線性迴歸
- 對數伽馬分佈
- 邏輯迴歸
- Mcnemar檢驗
- 平均偏差
- 均值差異
- 多項分佈
- 負二項分佈
- 正態分佈
- 奇排列和偶排列
- 單比例Z檢驗
- 離群值函式
- 排列
- 有放回排列
- 餅圖
- 泊松分佈
- 合併方差 (r)
- 功效計算器
- 機率
- 機率加法定理
- 機率乘法定理
- 機率貝葉斯定理
- 機率密度函式
- 過程能力 (Cp) & 過程效能 (Pp)
- 過程Sigma
- 二次迴歸方程
- 定性資料與定量資料
- 四分位差
- 經驗法則
- 瑞利分佈
- 迴歸截距置信區間
- 相對標準偏差
- 信度係數
- 所需樣本量
- 殘差分析
- 殘差平方和
- 均方根
- 樣本計劃
- 抽樣方法
- 散點圖
- Shannon Wiener多樣性指數
- 信噪比
- 簡單隨機抽樣
- 偏度
- 標準差
- 標準誤 (SE)
- 標準正態表
- 統計顯著性
- 統計公式
- 統計符號
- 莖葉圖
- 分層抽樣
- 學生t檢驗
- 平方和
- t分佈表
- Ti 83指數迴歸
- 變換
- 截尾均值
- I型和II型錯誤
- 方差
- 韋恩圖
- 大數弱定律
- Z表
- 統計學有用資源
- 統計學 - 討論
統計學 - Kolmogorov Smirnov檢驗
此檢驗用於需要比較觀察樣本分佈與理論分佈的情況。
K-S單樣本檢驗
此檢驗用作擬合優度檢驗,當樣本量較小時非常理想。它將變數的累積分佈函式與指定的分佈進行比較。零假設假設觀察分佈與理論分佈之間沒有差異,並且檢驗統計量“D”的值計算如下
公式
$D = 最大值 |F_o(X)-F_r(X)|$
其中 -
${F_o(X)}$ = n個觀測值的隨機樣本的觀察累積頻率分佈。
以及 ${F_o(X) = \frac{k}{n}}$ = (≤X的觀測值數)/(觀測值總數)。
${F_r(X)}$ = 理論頻率分佈。
從K-S表中找到單樣本檢驗的${D}$的臨界值。
接受標準:如果計算值小於臨界值,則接受零假設。
拒絕標準:如果計算值大於表值,則拒絕零假設。
示例
問題陳述
在一項針對大學不同專業的60名學生的調查中,從每個專業抽取相同數量的學生進行訪談,並記錄了他們加入大學戲劇俱樂部的意願。
理學士 | 文學士 | 工商管理學士 | 文學碩士 | 工商管理碩士 | |
---|---|---|---|---|---|
每個班級的數量 | 5 | 9 | 11 | 16 | 19 |
預計每個班級的12名學生將加入戲劇俱樂部。使用K-S檢驗來確定學生班級在加入戲劇俱樂部的意願方面是否存在差異。
解決方案
${H_o}$:不同專業的學生在加入戲劇俱樂部的意願方面沒有差異。
我們為觀察分佈和理論分佈開發累積頻率。
專業 | 有興趣加入的學生人數 | ${F_O(X)}$ | ${F_T(X)}$ | ${|F_O(X)-F_T(X)|}$ | |
---|---|---|---|---|---|
觀察值 (O) | 理論值 (T) | ||||
理學士 | 5 | 12 | 5/60 | 12/60 | 7/60 |
文學士 | 9 | 12 | 14/60 | 24/60 | 10/60 |
工商管理學士 | 11 | 12 | 25/60 | 36/60 | 11/60 |
文學碩士 | 16 | 12 | 41/60 | 48/60 | 7/60 |
工商管理碩士 | 19 | 12 | 60/40 | 60/60 | 60/60 |
總數 | n=60 | ||||
檢驗統計量${|D|}$計算如下
在5%顯著性水平下,D的表值由下式給出
由於計算值大於臨界值,因此我們拒絕零假設,並得出結論,不同專業的學生在加入俱樂部的意願方面存在差異。
K-S雙樣本檢驗
當有兩個獨立樣本而不是一個樣本時,可以使用K-S雙樣本檢驗來檢驗兩個累積分佈之間的一致性。零假設表明兩個分佈之間沒有差異。D統計量的計算方式與K-S單樣本檢驗相同。
公式
${D = 最大值 |{F_n}_1(X)-{F_n}_2(X)|}$
其中 -
${n_1}$ = 第一個樣本的觀測值。
${n_2}$ = 第二個樣本的觀測值。
可以看出,當累積分佈顯示較大的最大偏差${|D|}$時,表明兩個樣本分佈之間存在差異。
對於${n_1 = n_2}$且≤ 40的樣本,使用雙樣本情況下的K-S表來查詢D的臨界值。當${n_1}$和/或${n_2}$ > 40時,應使用雙樣本大樣本的K-S表。如果計算值小於表值,則接受零假設,反之亦然。
因此,使用任何這些非引數檢驗都可以幫助研究人員在目標總體特徵未知或未對其進行任何假設的情況下檢驗結果的顯著性。