平均數、中位數和眾數之間的關係
介紹
在統計學中,資料是基於某些自然或人為的數學現象的資訊集合。
有多種方法可以研究資料並解釋數學現象的某些屬性,但最常見的是集中趨勢。顧名思義,集中趨勢是一種用多種不同方法查詢給定資料中所有觀測值的中心的方法,第一種方法是將所有觀測值相加,然後將該和除以觀測值的個數,稱為平均數;另一種方法是隻選擇最常見的觀測值,稱為眾數;還有一種方法是,當資料按順序排列時,選擇中間的觀測值,稱為中位數。在本教程中,我們將學習集中趨勢及其相互之間的關係。
集中趨勢
集中趨勢是一種查詢最常見觀測值或最常見觀測值區域的方法。統計學中有三種集中趨勢:
平均數
中位數
眾數
平均數
平均數是一種集中趨勢,它選擇大多數其他觀測值圍繞其分佈的觀測值,它是透過用該值將資料分成兩部分來實現的,即平均數是給定資料的中間值,使得小於或大於平均數的所有觀測值的數值相同。
平均數通常用觀測值符號上方的橫線表示,即最常見的是$\mathrm{\overline{x}}$。
有多種平均數,例如算術平均數、幾何平均數和調和平均數。最常見和最常用的平均數是算術平均數。算術平均數是透過將所有觀測值相加,然後將該和除以觀測值的總數來計算的。
未分組資料的平均數公式為:
$$\mathrm{\overline{x}\:=\:\frac{\Sigma\:x_{i}}{N}}$$
其中N是觀測值的總數,𝑥𝑖是第i個觀測值。
分組資料的平均數公式為:
$$\mathrm{\overline{x}\:=\:\frac{\Sigma\:f_{i}x_{i}}{\Sigma\:f_{i}}}$$
其中$\mathrm{x_{i}}$是第i個觀測值,$\mathrm{f_{i}}$是其頻數,並且$\mathrm{\Sigma\:f_{i}\:=\:N}$
中位數
中位數,顧名思義,就是中間的觀測值,即當資料按順序排列時,中間的觀測值就是中位數。
未分組資料的中間數
未分組資料的中間數是透過將觀測值按升序排列來計算的,如果觀測值的個數是奇數,則中位數是中間的觀測值;如果觀測值的個數是偶數,則中位數是兩個中間觀測值的平均值。
即,如果觀測值的個數N是奇數
$$\mathrm{中位數\:=\;(\frac{N\:+\:1}{2})^{th}\:觀測值}$$
如果觀測值的個數N是偶數,則
$$\mathrm{中位數\:=\frac{\;(\frac{N}{2})^{th}\:觀測值\:+\:(\frac{N}{2}\:+\:1)^{th}\:觀測值}{2}}$$
分組資料的中間數
為了找到分組資料的中間數,我們構造一個累積頻率表:
在累積頻率表中,對應於略大於觀測值總數一半的頻率的觀測值就是中位數。
如果資料被分成類別,則公式如下:
$$\mathrm{中位數\:=\:l\:+\:\frac{\frac{n}{2}\:-\:cf}{f}\:\times\;h}$$
其中l是中位數類別的下限,cf是剛好小於觀測值總數n的一半的累積頻率,f是對應於中位數類別的頻率,h是類別區間的寬度。
眾數
眾數是集中趨勢中最常見的觀測值。
未分組資料的眾數
未分組資料的眾數就是出現頻率最高的項。
分組資料的眾數
分組資料的眾數是頻率最高的觀測值。
如果資料被分類成類別區間,則眾數的公式為:
$$\mathrm{眾數\:=\:l\:+\:\frac{f_{1}\:-\:f_{0}}{2^f_{1}\:-\:f_{0}\:-\:f_{2}}\:\times\:h}$$
其中l是眾數類別的下限,𝑓1是眾數頻率(最高頻率),𝑓0和𝑓2分別是眾數類別上方和下方類別的頻率,h是類別的寬度。
經驗關係
三種集中趨勢之間的關係稱為經驗關係,其公式為
$$\mathrm{3中位數\:=\:2平均數\:+\:眾數}$$
隨著資料樣本量的增加,經驗關係變得越來越準確。
已解決示例
1) 找到以下資料的三個集中趨勢,並驗證經驗關係。
| $\mathrm{x_{i}}$ | 10 | 12 | 13 | 15 | 17 | 18 | 20 | 23 | 25 |
|---|---|---|---|---|---|---|---|---|---|
| $\mathrm{f_{i}}$ | 3 | 5 | 6 | 7 | 9 | 8 | 6 | 4 | 2 |
答案 -
平均數
| $\mathrm{x_{i}}$ | 10 | 12 | 13 | 15 | 17 | 18 | 20 | 23 | 25 | |
|---|---|---|---|---|---|---|---|---|---|---|
| $\mathrm{f_{i}}$ | 3 | 5 | 6 | 7 | 9 | 8 | 6 | 4 | 2 | $\mathrm{\Sigma\:f_{i}\:=\:50}$ |
| $\mathrm{f_{i}\:x_{i}}$ | 30 | 60 | 78 | 105 | 153 | 144 | 120 | 92 | 50 | $\mathrm{\Sigma\:f_{i}\:x_{i}\:=\:832}$ |
$\mathrm{平均數\:=\:\overline{x}\:=\:\frac{\Sigma\:f_{i}x_{i}}{\Sigma\:f_{i}}\:=\:\frac{832}{50}\:=\:16.64}$
中位數
| $\mathrm{x_{i}}$ | 10 | 12 | 13 | 15 | 17 | 18 | 20 | 23 | 25 |
|---|---|---|---|---|---|---|---|---|---|
| $\mathrm{f_{i}}$ | 3 | 5 | 6 | 7 | 9 | 8 | 6 | 4 | 2 |
| 累積頻率 (C.F) | 3 | 8 | 14 | 21 | 30 | 38 | 44 | 47 | 50 |
這裡,$\mathrm{N\:=\:50\:\Longrightarrow\:\frac{N}{2}\:=\:25}$
這意味著𝑐𝑓 = 30
中位數 = 17
眾數
在頻率表中,最高頻率對應於17
$\mathrm{\Longrightarrow\:眾數\:=\:17}$
三個集中趨勢是:
平均數 = 16.64
中位數 = 17
眾數 = 17
經驗關係
$$\mathrm{3中位數\:=\:2平均數\:+\:眾數}$$
$$\mathrm{3\times\:17\:=\:2\times\:16.64\:+\:17}$$
$$\mathrm{51\:\approx\:50.28}$$
結論
集中趨勢是一種在資料觀測值之間找到某種“共同點”的方法。
有三種不同的集中趨勢:
平均數 - 它是觀測值的平均值。它按總值將資料分成兩半。
眾數 - 它是資料中最常見的觀測值。出現頻率最高的觀測值也是集中趨勢的度量。
中位數 - 它是按順序排列時最中心的觀測值。位於排列資料中間的觀測值也是集中趨勢的度量。
三種不同集中趨勢之間的關係稱為經驗關係。它如下所示:
$$\mathrm{3中位數\:=\:2平均數\:+\:眾數}$$
常見問題解答 (FAQs)
1. 什麼是集中趨勢?
集中趨勢被定義為一種在資料所有觀測值之間找到中心“共同點”的方法。
有三種不同型別的集中趨勢。
平均數
中位數
眾數
2. 什麼是平均數?分組資料和未分組資料的平均數公式是什麼?
平均數被定義為將資料分成總值相等的兩部分的數。
有三種不同型別的平均數:算術平均數 (AM)、幾何平均數 (GM) 和調和平均數 (HM)。但是,通常在談論平均數時,我們通常指的是算術平均數。
算術平均數是所有資料的平均值,即所有觀測值的總和除以觀測值的總數。
對於未分組資料:
$\mathrm{\overline{x}\:=\:\frac{\Sigma\:x_{i}}{N}}$,其中N是觀測值的總數,𝑥𝑖是第i個觀測值。
對於分組資料:
$\mathrm{\overline{x}\:=\:\frac{\Sigma\:f_{i}x_{i}}{\Sigma\:f_{i}}}$,其中$\mathrm{x_{i}}$是第i個觀測值,$\mathrm{f_{i}}$是其頻數,並且$\mathrm{\Sigma\:f_{i}\:=\:N}$,即觀測值的總數。
3. 什麼是中位數?求分組資料和未分組資料的中位數的公式是什麼?
中位數被定義為最中心的觀測值。
未分組資料的中位數只是最中心的觀測值或兩個最中心觀測值的平均值。
分組資料的中位數是使用累積頻率表計算的。
對於簡單的分組資料,中位數是對應於略大於總頻率一半的項。
對於類別區間:
$$\mathrm{中位數\:=\:l\:+\:\frac{\frac{n}{2}\:-\:cf}{f}\:\times\:h}$$
其中l是中位數類別的下限,cf是剛好小於觀測值總數n的一半的累積頻率,f是對應於中位數類別的頻率,h是類別區間的寬度。
4. 什麼是眾數?分組資料和非分組資料的眾數公式是什麼?
眾數定義為出現頻率最高的觀測值。
非分組資料和簡單分組資料的眾數是頻率最高的觀測值。
組距資料的眾數:
$$ \mathrm{眾數} = l + \frac{f_1 - f_0}{2f_1 - f_0 - f_2} \times h $$
其中,l 是眾陣列的組下限,𝑓1 是眾數頻率(最高頻率),𝑓0 和 𝑓2 分別是眾陣列上下組的頻率,h 是組距。
5. 經驗關係是什麼?
平均數、中位數和眾數之間的關係稱為經驗關係。
$$\mathrm{3中位數\:=\:2平均數\:+\:眾數}$$
資料結構
網路
關係型資料庫管理系統 (RDBMS)
作業系統
Java
iOS
HTML
CSS
Android
Python
C語言程式設計
C++
C#
MongoDB
MySQL
Javascript
PHP