配對樣本t檢驗
介紹
在統計學中,配對樣本t檢驗是一種用於比較兩組樣本之間資料的工具,它確定給定測量值之間的平均差異是否為零。在統計學中,雙樣本t檢驗是用於比較兩個資料集均值的工具。這些檢驗也稱為學生t檢驗,檢驗結果用於評估兩個樣本均值之間的差異。這種差異不太可能是由於抽樣誤差或偶然性造成的。配對樣本t檢驗用於比較兩個資料集的均值,其中我們獲得兩個樣本,並進行比較以確定差異是否為零。
定義
當每個樣本都由一對測量值進行評估時,使用配對樣本t檢驗,其中配對樣本t檢驗確定這些樣本的平均變化是否為零。配對樣本t檢驗用作一種統計程式,使用觀察結果來得出資料集之間的結論。
例如
當對同一受試者進行了兩次觀察(例如,特定觀察結果的某人的診斷測試結果)。
某類測量的兩組觀察結果,其中兩組觀察結果都屬於同一受試者。(例如,使用身高、體重和年齡的體重指數)。
公式
使用配對樣本t檢驗的公式時,遵循兩個假設,即零假設和備擇假設。
在零假設中,假設配對樣本的均值之差為零。另一方面,在備擇假設中,假設配對樣本之間的差異不為零。根據結果的高低值,備擇假設還有進一步的擴充套件。
上述假設可以表示為:
零假設,H0:d1 = d2 或 H0:d1 - d2 = 0。
備擇假設,H1:d1≠d2 或 H1:d1 - d2 ≠ 0。
這裡:
d1 是樣本1的均值
d2 是總體中樣本2的均值
計算配對樣本t檢驗的公式:
$$\mathrm{t = \frac{m}{\frac{s}{√n}}}$$
其中,m 是均值,s 表示均值差 (d) 的標準差,n 表示“d”的大小。
表格
下表是配對樣本t檢驗表,允許將t檢驗中的t值解釋為陳述形式。下表給出:
雙尾顯著性 | ||||||
---|---|---|---|---|---|---|
自由度 (n-1) | $$\mathrm{\alpha=0.20}$$ | 0.1 | 0.05 | 0.02 | 0.01 | 0.002 |
1 | 3.078 | 6.314 | 12.706 | 31.821 | 63.657 | 318.3 |
2 | 1.886 | 2.92 | 4.303 | 6.965 | 9.925 | 22.327 |
3 | 1.638 | 2.353 | 3.182 | 4.541 | 5.841 | 10.214 |
4 | 1.533 | 2.132 | 2.776 | 3.747 | 4.604 | 7.173 |
5 | 1.476 | 2.015 | 2.571 | 3.305 | 4.032 | 5.893 |
6 | 1.44 | 1.943 | 2.447 | 3.143 | 3.707 | 5.208 |
7 | 1.415 | 1.895 | 2.365 | 2.998 | 3.499 | 4.785 |
8 | 1.397 | 1.86 | 2.306 | 2.896 | 3.355 | 4.501 |
9 | 1.383 | 1.833 | 2.262 | 2.821 | 3.25 | 4.297 |
10 | 1.372 | 1.812 | 2.228 | 2.764 | 3.169 | 4.144 |
11 | 1.363 | 1.796 | 2.201 | 2.718 | 3.106 | 4.025 |
12 | 1.356 | 1.782 | 2.179 | 2.681 | 3.055 | 3.93 |
13 | 1.35 | 1.771 | 2.16 | 2.65 | 3.012 | 3.852 |
14 | 1.345 | 1.761 | 2.145 | 2.624 | 2.977 | 3.787 |
15 | 1.341 | 1.753 | 2.131 | 2.602 | 2.947 | 3.733 |
也稱為依賴樣本t檢驗,這告訴我們兩個觀察結果是配對的或依賴的,因為它們包含相同受試者的資料。
配對t檢驗與非配對t檢驗
配對t檢驗和非配對t檢驗有一些區別,可以列為:
配對t檢驗 | 非配對t檢驗 |
---|---|
用於比較同一組或專案在兩種相似情況下的平均差異。 | 當比較兩組獨立樣本之間的平均差異時,使用非配對t檢驗。 |
在非配對t檢驗中,假設兩個資料集之間的方差相等。 | 在配對t檢驗中,不假設兩個資料集之間的方差相等。 |
使用兩個因變數。 | 使用一個因變數和一個自變數。 |
如何進行配對樣本t檢驗
讓我們假設對n名學生進行了一次模組學習前的診斷測試,然後在完成模組學習後第二次進行相同的診斷測試。現在我們想了解學生在該模組方面的能力(如知識和技能)的具體改進。我們學生群體中的結果可用於比較該模組的效果。
讓我們假設模組1和模組2的結果資料集為A和B,其中$\mathrm{x_i \in A, y_i \in B}$。其中i = 1, 2,……., n。以下是應用配對樣本t檢驗的步驟:
根據零假設,我們假設實際均值差為零。
計算兩組觀察值之間的差異 (di = yi- xi)。
確定均值差,$\mathrm{\underline{d}}$。
評估標準差 (SD),然後確定標準誤差,$\mathrm{SE(\underline{d}) =SD/\sqrt{n}}$。
t統計量值由$\mathrm{T=\underline{d}\: SE(\underline{d})}$確定。考慮到零假設,自由度取為“n − 1”。
參考t分佈表,並將T與tn-1分佈進行比較,我們得到配對樣本t檢驗的p值。
已解決示例
讓我們假設學生在兩次不同測試中的分數如下所示。
學生 | 測試1分數 | 測試2分數 | 差異 |
---|---|---|---|
A | 63 | 69 | 6 |
B | 65 | 65 | 0 |
C | 56 | 62 | 6 |
D | 100 | 91 | -9 |
E | 88 | 78 | -10 |
F | 83 | 87 | 4 |
G | 77 | 79 | 2 |
H | 92 | 88 | -4 |
I | 90 | 85 | -5 |
J | 84 | 92 | 8 |
K | 68 | 69 | 1 |
L | 74 | 81 | 7 |
M | 87 | 84 | -3 |
N | 64 | 75 | 11 |
O | 71 | 84 | 13 |
P | 88 | 82 | -6 |
假設
設H0為分數之間的均值差,假設為零。
設H1為分數之間的均值差,不認為是零。
均值差;$\mathrm{\overline{d}=1.31}$
標準誤差 − $\mathrm{(\overline{d}) =SD/\sqrt{n}=1.75}$
假設我們的顯著性水平為α = 0.05。
現在我們計算檢驗統計量 t= $\mathrm{(\overline{d})/SE=1.31/1.75=0.750}$
自由度 df=n-1=15。
參考上表,α = 0.05 和 15 個自由度的 t 值為 2.131。
透過將 t 統計量值與 t 值進行比較,我們觀察到 0.750 小於 2.131。因此,我們可以同意我們的假設,即均值差為零。兩次考試似乎同樣困難。
結論
在統計學中,雙樣本t檢驗是用於分析兩個總體均值的工具。這些檢驗也稱為學生t檢驗。檢驗結果用於評估兩個資料集均值之間的差異。
例如,對同一受試者進行了兩次觀察(例如,特定觀察結果的某人的診斷測試結果)。使用配對樣本t檢驗的公式時,遵循兩個假設,即零假設和備擇假設。配對樣本t檢驗可用於比較同一資料集或總體在兩種情況下的均值。另一方面,非配對t檢驗比較兩個獨立資料集的均值。
常見問題
1. 配對樣本t檢驗是否優於非配對樣本t檢驗?為什麼?
人們認為配對樣本t檢驗比非配對樣本t檢驗更準確,因為在配對樣本t檢驗中,相同的因變數消除了樣本之間的顯著偏差,而非配對樣本t檢驗則不然。
2. 在配對樣本t檢驗中,組間的偏差可以相等嗎?
不可以,在配對樣本t檢驗中,組間的偏差不相等。
3. 在非配對樣本t檢驗中,組間的偏差可以相等嗎?
可以,在非配對樣本t檢驗中,組間的偏差相等。
4. 如果非配對樣本t檢驗中組間的偏差不相等,該怎麼辦?
對於非配對樣本t檢驗,如果偏差不匹配,則進行 Welch 檢驗。
5. 零假設和備擇假設之間有什麼區別?
對於零假設,總體的均值差等於零;而在備擇假設中,總體的均值差不等於零。