- 統計學教程
- 首頁
- 調整後的R平方
- 方差分析
- 算術平均數
- 算術中位數
- 算術眾數
- 算術極差
- 條形圖
- 最佳點估計
- 貝塔分佈
- 二項分佈
- 布萊克-斯科爾斯模型
- 箱線圖
- 中心極限定理
- 切比雪夫定理
- 卡方分佈
- 卡方表
- 環排列
- 整群抽樣
- 科恩Kappa係數
- 組合
- 有放回組合
- 比較圖表
- 連續均勻分佈
- 連續數列算術平均數
- 連續數列算術中位數
- 連續數列算術眾數
- 累積頻率
- 變異係數
- 相關係數
- 累積圖
- 累積泊松分佈
- 資料收集
- 資料收集 - 問卷設計
- 資料收集 - 觀察法
- 資料收集 - 案例研究法
- 資料模式
- 十分位數統計
- 離散數列算術平均數
- 離散數列算術中位數
- 離散數列算術眾數
- 點圖
- 指數分佈
- F分佈
- F檢驗表
- 階乘
- 頻率分佈
- 伽馬分佈
- 幾何平均數
- 幾何機率分佈
- 擬合優度
- 總平均數
- Gumbel分佈
- 調和平均數
- 調和數
- 諧振頻率
- 直方圖
- 超幾何分佈
- 假設檢驗
- 個體數列算術平均數
- 個體數列算術中位數
- 個體數列算術眾數
- 區間估計
- 逆伽馬分佈
- Kolmogorov-Smirnov檢驗
- 峰度
- 拉普拉斯分佈
- 線性迴歸
- 對數伽馬分佈
- 邏輯迴歸
- 麥克尼馬爾檢驗
- 平均偏差
- 均值差異
- 多項分佈
- 負二項分佈
- 正態分佈
- 奇排列和偶排列
- 單比例Z檢驗
- 異常值函式
- 排列
- 有放回排列
- 餅圖
- 泊松分佈
- 合併方差(r)
- 功效計算器
- 機率
- 機率加法定理
- 機率乘法定理
- 機率貝葉斯定理
- 機率密度函式
- 過程能力(Cp)和過程效能(Pp)
- 過程Sigma
- 二次迴歸方程
- 定性資料與定量資料
- 四分位差
- 經驗法則
- 瑞利分佈
- 迴歸截距置信區間
- 相對標準偏差
- 信度係數
- 所需樣本量
- 殘差分析
- 殘差平方和
- 均方根
- 樣本計劃
- 抽樣方法
- 散點圖
- 夏農-維納多樣性指數
- 信噪比
- 簡單隨機抽樣
- 偏度
- 標準差
- 標準誤(SE)
- 標準正態表
- 統計顯著性
- 統計公式
- 統計符號
- 莖葉圖
- 分層抽樣
- 學生t檢驗
- 平方和
- t分佈表
- TI-83指數迴歸
- 轉換
- 截尾均值
- I型和II型錯誤
- 方差
- 韋恩圖
- 大數弱定律
- Z表
- 統計學有用資源
- 統計學 - 討論
統計學 - 異常值函式
在機率分佈函式中,異常值是指超出資料集長度1.5倍的數字,遠離下四分位數或上四分位數。具體來說,如果一個數字小於${Q_1 - 1.5 \times IQR}$或大於${Q_3 + 1.5 \times IQR}$,則它是一個異常值。
異常值由以下機率函式定義和給出
公式
${異常值資料\lt Q_1 - 1.5 \times IQR\ (或)\ \gt Q_3 + 1.5 \times IQR }$
其中 -
${Q_1}$ = 第一四分位數
${Q_2}$ = 第三四分位數
${IQR}$ = 四分位距
示例
問題陳述
考慮一個數據集,該資料集表示8個不同學生的週期性任務計數。任務計數資訊集為11、13、15、3、16、25、12和14。從學生的週期性任務計數中發現異常值資料。
解決方案
給定資料集為
| 11 | 13 | 15 | 3 | 16 | 25 | 12 | 14 |
按升序排列
| 3 | 11 | 12 | 13 | 14 | 15 | 16 | 25 |
第一四分位數的值(${Q_1}$)
${ Q_1 = \frac{(11 + 12)}{2} \\[7pt] \ = 11.5 }$
第三四分位數的值(${Q_3}$)
${ Q_3 = \frac{(15 + 16)}{2} \\[7pt] \ = 15.5 }$
下異常值範圍(L)
${ Q_1 - 1.5 \times IQR \\[7pt] \ = 11.5 - (1.5 \times 4) \\[7pt] \ = 11.5 - 6 \\[7pt] \ = 5.5 }$
上異常值範圍(L)
${ Q_3 + 1.5 \times IQR \\[7pt] \ = 15.5 + (1.5 \times 4) \\[7pt] \ = 15.5 + 6 \\[7pt] \ = 21.5 }$
在給定的資訊中,5.5和21.5大於給定資料集中的其他值,即除了3和25之外,因為3大於5.5,而25小於21.5。
這樣,我們使用3和25作為異常值。