理解平均數的型別
介紹
一組資料點、觀察值或值的平均值稱為資料的平均數。它是集中趨勢的度量。
在數學上,平均數是透過將值的總和除以值或觀察值的個數得到的。它也稱為期望值。平均數本身並不侷限於這種簡單的形式,而是具有不同的型別,例如算術平均數、幾何平均數、調和平均數和加權平均數。
數學上表示為:
$$\mathrm{平均數=\frac{\sum x}{N}}$$
其中:
x = 觀察值集合
N = 觀察值的個數
不同型別的平均數
算術平均數
它是資料/觀察值的算術平均值。它表示為觀察值的總和除以此類觀察值的總數。
例如,假設 x_1,x_2,x_3,x_4,....,x_n 是 n 個觀察值,則算術平均數 μ 為:
$$\mathrm{\mu=\frac{x_1 +x_2+x_3+...+x_n}{n}=\frac{\sum x}{n}}$$
如果 3、4、5、8、10 是一組 5 個觀察值,則算術平均數將為:
$$\mathrm{\mu=\frac{3+4+5+8+10}{5}=6}$$
幾何平均數
幾何平均數表示為資料集中所有觀察值/值的乘積的 n 次方根。它通常小於算術平均數,並且通常用於資料波動的情況下,例如投資用例。
例如,假設 x_1,x_2,x_3,x_4,....,x_n 是 n 個觀察值,則幾何平均數 G 表示為:
$$\mathrm{G=\sqrt[n]{x_1,x_2,x_3,\ldots,xn}}$$
三個觀察值 2、4 和 8 的幾何平均數將為:
$$\mathrm{G=\sqrt[n]{2\times 4\times 8}=\sqrt[n]{64}=4}$$
但是,當根較大時,對觀察值取對數來計算幾何平均數會更容易得多。這從下面的表示中可以看出:
$$\mathrm{\log G = \frac{\log x_1+log x_2+log x_3+...+log x_n}{n}=\frac{log \sum x}{n}}$$
在上面 2、4、8 的觀察值示例中應用對數:
$$\mathrm{\log G = \frac{\log 2+\log 4+\log 8}{n}=\frac{0.3010+0.6020+0.9030}{3}=0.602}$$
G = antilog 0.602 = 4
調和平均數
調和平均數定義為值的倒數的算術平均數的倒數。換句話說,將觀察值的個數除以值的倒數之和即可得到調和平均數。在數學上,對於觀察值 x_1,x_2,x_3,x_4,....,x_n:
$$\mathrm{H=\frac{n}{\frac{1}{x_1}+\frac{1}{x_2}+\frac{1}{x_3}+\frac{1}{x_4}+\dotso+\frac{1}{x_n}}}$$
例如,2、4 和 8 的調和平均數將為:
$$\mathrm{H=\frac{3}{\frac{1}{2}+\frac{1}{4}+\frac{1}{8}}=\frac{3}{0.5 + 0.25+ 0.125}=3.428}$$
加權平均數/平均值
當每個觀察值在平均數計算中具有不同的重要性時,使用加權平均數。每個觀察值都加權為 w 因子。加權平均數是透過將每個觀察值的加權值之和除以觀察值的權重之和來計算的。在數學上,對於觀察值 x_1,x_2,x_3,...,x_n 及其權重 w_1,w_2,w_3,...w_n:
$$\mathrm{\mu_w=\frac{w_1x_1+w_2x_2+w_3x_3\dotso+w_nx_n}{w_1+w_2+w_3+\dotso+w_n}=\frac{\sum wx}{\sum w}}$$
例如,假設學生在三門課程中的分數分別為 90、80 和 70,並且相應分配給這些課程的權重分別為 5、7 和 9,則加權平均數將為:
$$\mathrm{\mu_w = \frac{5\times 90+7\times 80+9\times 70}{5+7+9}=78.09}$$
結論
平均數是統計學和機器學習中最流行和最重要的集中趨勢之一。它總結了整個資料。瞭解平均數有助於得出關於資料集的重要見解。平均數的型別包括算術平均數、幾何平均數、調和平均數和加權平均數。
資料結構
網路
關係型資料庫管理系統 (RDBMS)
作業系統
Java
iOS
HTML
CSS
Android
Python
C 程式設計
C++
C#
MongoDB
MySQL
Javascript
PHP