
- 統計學教程
- 首頁
- 調整後的R方
- 方差分析
- 算術平均數
- 算術中位數
- 算術眾數
- 算術極差
- 條形圖
- 最佳點估計
- 貝塔分佈
- 二項分佈
- 布萊克-斯科爾斯模型
- 箱線圖
- 中心極限定理
- 切比雪夫定理
- 卡方分佈
- 卡方表
- 環狀排列
- 整群抽樣
- 科恩 Kappa 係數
- 組合
- 可重複組合
- 比較圖表
- 連續均勻分佈
- 連續數列算術平均數
- 連續數列算術中位數
- 連續數列算術眾數
- 累積頻率
- 變異係數
- 相關係數
- 累積圖
- 累積泊松分佈
- 資料收集
- 資料收集 - 問卷設計
- 資料收集 - 觀察法
- 資料收集 - 案例研究法
- 資料模式
- 十分位數統計
- 離散數列算術平均數
- 離散數列算術中位數
- 離散數列算術眾數
- 點圖
- 指數分佈
- F分佈
- F檢驗表
- 階乘
- 頻數分佈
- 伽馬分佈
- 幾何平均數
- 幾何機率分佈
- 擬合優度
- 總平均數
- Gumbel 分佈
- 調和平均數
- 調和數
- 諧振頻率
- 直方圖
- 超幾何分佈
- 假設檢驗
- 個體數列算術平均數
- 個體數列算術中位數
- 個體數列算術眾數
- 區間估計
- 逆伽馬分佈
- Kolmogorov-Smirnov 檢驗
- 峰度
- 拉普拉斯分佈
- 線性迴歸
- 對數伽馬分佈
- 邏輯迴歸
- 麥克尼馬爾檢驗
- 平均差
- 均值差異
- 多項分佈
- 負二項分佈
- 正態分佈
- 奇排列和偶排列
- 單比例Z檢驗
- 異常值函式
- 排列
- 可重複排列
- 餅圖
- 泊松分佈
- 合併方差 (r)
- 功效計算器
- 機率
- 機率加法定理
- 機率乘法定理
- 機率貝葉斯定理
- 機率密度函式
- 過程能力 (Cp) 和過程效能 (Pp)
- 過程Sigma
- 二次迴歸方程
- 定性資料與定量資料
- 四分位差
- 經驗法則
- 瑞利分佈
- 迴歸截距置信區間
- 相對標準差
- 信度係數
- 所需樣本量
- 殘差分析
- 殘差平方和
- 均方根
- 樣本規劃
- 抽樣方法
- 散點圖
- 夏農-威納多樣性指數
- 信噪比
- 簡單隨機抽樣
- 偏度
- 標準差
- 標準誤 (SE)
- 標準正態表
- 統計顯著性
- 統計公式
- 統計符號
- 莖葉圖
- 分層抽樣
- 學生t檢驗
- 平方和
- t分佈表
- TI-83 指數迴歸
- 變換
- 截尾均值
- I型和II型錯誤
- 方差
- 維恩圖
- 大數弱定律
- Z表
- 統計學有用資源
- 統計學 - 討論
統計學 - 峰度
峰度衡量的是分佈的尾部特徵,它告訴我們分佈比正態分佈更容易或更不容易出現離群值(尾部較重或較輕)的程度。Investopedia 提供的三種不同型別的曲線如下:

從密度圖(左圖)中很難辨別不同型別的峰度,因為所有分佈的尾部都接近於零。但是,在正態分位數-分位數圖(右圖)中,尾部的差異很容易看到。
正態曲線稱為正態峰度曲線。如果一個分佈的曲線比正態曲線或正態峰度曲線更容易出現離群值(或尾部較重),則它被稱為尖峰峰度曲線。如果一條曲線的離群值比正態曲線少(或尾部較輕),則它被稱為低峰峰度曲線。峰度由矩來衡量,其公式如下:
公式
$\beta_2 = \frac{\mu_4}{\mu_2^2}$
其中:
$\mu_4 = \frac{\sum(x- \bar x)^4}{N}$
$\beta_2$ 值越大,曲線越尖銳或越尖峰。正態曲線的 $\beta_2$ 值為 3,尖峰峰度曲線的 $\beta_2$ 值大於 3,低峰峰度曲線的 $\beta_2$ 值小於 3。
示例
問題陳述
給出了某工廠 45 名工人的日工資資料。使用關於均值的矩計算 $\beta_1$ 和 $\beta_2$。對結果進行評論。
工資(盧比) | 工人數量 |
---|---|
100-200 | 1 |
120-200 | 2 |
140-200 | 6 |
160-200 | 20 |
180-200 | 11 |
200-200 | 3 |
220-200 | 2 |
解答
工資 (盧比) | 工人數量 (f) | 中點 m | m-$\frac{170}{20}$ d | fd | fd² | fd³ | fd⁴ |
---|---|---|---|---|---|---|---|
100-200 | 1 | 110 | -3 | -3 | 9 | -27 | 81 |
120-200 | 2 | 130 | -2 | -4 | 8 | -16 | 32 |
140-200 | 6 | 150 | -1 | -6 | 6 | -6 | 6 |
160-200 | 20 | 170 | 0 | 0 | 0 | 0 | 0 |
180-200 | 11 | 190 | 1 | 11 | 11 | 11 | 11 |
200-200 | 3 | 210 | 2 | 6 | 12 | 24 | 48 |
220-200 | 2 | 230 | 3 | 6 | 18 | 54 | 162 |
N=45 | $\sum fd = 10$ | $\sum fd^2 = 64$ | $\sum fd^3 = 40$ | $\sum fd^4 = 330$ |
由於偏差是從假設均值計算的,因此我們首先計算關於任意原點的矩,然後計算關於均值的矩。關於任意原點'170'的矩
$\mu_1' = \frac{\sum fd}{N} \times i = \frac{10}{45} \times 20 = 4.44 \\ \mu_2' = \frac{\sum fd^2}{N} \times i^2 = \frac{64}{45} \times 20^2 = 568.88 \\ \mu_3' = \frac{\sum fd^3}{N} \times i^3 = \frac{40}{45} \times 20^3 = 7111.11 \\ \mu_4' = \frac{\sum fd^4}{N} \times i^4 = \frac{330}{45} \times 20^4 = 1173333.33$
關於均值的矩
$\mu_2 = \mu_2' - (\mu_1')^2 = 568.88 - (4.44)^2 = 549.16 \\ \mu_3 = \mu_3' - 3(\mu_1')(\mu_2') + 2(\mu_1')^3 \\ = 7111.11 - (4.44)(568.88) + 2(4.44)^3 \\ = 7111.11 - 7577.48 + 175.05 = -291.32 \\ \mu_4 = \mu_4' - 4(\mu_1')(\mu_3') + 6(\mu_1')^2(\mu_2') - 3(\mu_1')^4 \\ = 1173333.33 - 4(4.44)(7111.11) + 6(4.44)^2(568.88) - 3(4.44)^4 \\ = 1173333.33 - 126293.31 + 67288.03 - 1165.87 \\ = 1113162.18$
根據關於均值的矩的值,我們現在可以計算 $\beta_1$ 和 $\beta_2$
$\beta_1 = \frac{\mu_3^2}{\mu_2^3} = \frac{(-291.32)^2}{(549.16)^3} = 0.00051 \\ \beta_2 = \frac{\mu_4}{\mu_2^2} = \frac{1113162.18}{(546.16)^2} = 3.69$
從上述計算可以得出結論,衡量偏度的 $\beta_1$ 幾乎為零,表明分佈幾乎是對稱的。衡量峰度的 $\beta_2$ 值大於 3,因此意味著分佈為尖峰峰度。
廣告