如何在 Python 中根據 t 分數查詢 P 值?
資料是一種寶貴的資產,在當今社會發揮著至關重要的作用,因為一切都強烈依賴於資料。如今,所有技術都是資料驅動的,並且定期生成海量資料。資料是未經處理的資訊,資料科學家學習如何利用這些資訊。資料科學家是一種專業人士,他們分析資料來源,清理和處理資料,以便了解資料是如何以及為何建立的,以便提供見解來支援業務決策,從而為公司帶來利潤。為了檢測資料中的模式和趨勢,資料科學家使用統計公式和計算機演算法的組合。在這篇文章中,我們將仔細研究 P 值和 t 分數,以及如何在 Python 中根據 t 分數查詢 P 值。
什麼是 P 值?
在統計學中,p 值是在原假設成立的情況下,產生至少與觀察到的統計檢驗結果一樣極端的結果的機率。p 值用於代替拒絕點來表示拒絕原假設的最小顯著性水平。p 值越低,表示更有證據支援備擇假設。
什麼是 t 分數?
t 分數,也稱為 t 值,是指與 t 分佈均值相差多少個標準差。t 分數是 t 檢驗和迴歸分析中使用的檢驗統計量。當資料服從 t 分佈時,它也可以用來表示觀察值距離均值的距離。
在 Python 中根據 t 分數計算 P 值
Python 中的 scipy.stats.t.sf() 函式具有以下語法,它可以用來獲取與給定 t 分數相對應的 p 值 -
scipy.stats.t.sf(abs(x), df)
其中 -
- x - t 分數
- df - 自由度
1. 左尾檢驗
假設我們希望獲取一個左尾假設檢驗的 p 值,其中 t 分數為 -
0.77 且 df = 15。
示例
!pip3 install scipy import scipy.stats #find p-value scipy.stats.t.sf(abs(-.77), df=15)
輸出
0.2266283049085413
使用 0.2266 的 p 值。由於此 p 值不小於 0.05,因此如果我們應用 = 0.05 的顯著性閾值,我們將無法拒絕假設檢驗的原假設。
2. 右尾檢驗
假設我們希望獲取一個右尾假設檢驗的 p 值,其中 t 分數為 1.87 且 df = 24。
示例
import scipy.stats #find p-value scipy.stats.t.sf(abs(1.87), df=24)
輸出
0.036865328383323424
p 值為 0.0368。由於此 p 值小於 0.05,因此如果我們應用 = 0.05 的顯著性閾值,我們將拒絕假設檢驗的原假設。
3. 雙尾檢驗
假設我們希望獲取一個雙尾假設檢驗的 p 值,其中 t 分數為 1.24 且 df = 22。
示例
import scipy.stats #find p-value for two-tailed test scipy.stats.t.sf(abs(1.24), df=22)*2
輸出
0.22803901531680093
p 值為 0.2280。由於此 p 值不小於 0.05,因此如果我們應用 = 0.05 的顯著性閾值,我們將無法拒絕假設檢驗的原假設。
結論
這裡討論了 P 值和 t 分數。這兩者都用於統計學中,從資料中獲取見解並幫助更準確地預測。此外,我們可以使用 Python 從 t 分數計算 P 值。
資料結構
網路
關係型資料庫管理系統
作業系統
Java
iOS
HTML
CSS
Android
Python
C 程式設計
C++
C#
MongoDB
MySQL
Javascript
PHP