如何在 Python 中根據 t 分數查詢 P 值?


資料是一種寶貴的資產,在當今社會發揮著至關重要的作用,因為一切都強烈依賴於資料。如今,所有技術都是資料驅動的,並且定期生成海量資料。資料是未經處理的資訊,資料科學家學習如何利用這些資訊。資料科學家是一種專業人士,他們分析資料來源,清理和處理資料,以便了解資料是如何以及為何建立的,以便提供見解來支援業務決策,從而為公司帶來利潤。為了檢測資料中的模式和趨勢,資料科學家使用統計公式和計算機演算法的組合。在這篇文章中,我們將仔細研究 P 值和 t 分數,以及如何在 Python 中根據 t 分數查詢 P 值。

什麼是 P 值?

在統計學中,p 值是在原假設成立的情況下,產生至少與觀察到的統計檢驗結果一樣極端的結果的機率。p 值用於代替拒絕點來表示拒絕原假設的最小顯著性水平。p 值越低,表示更有證據支援備擇假設。

什麼是 t 分數?

t 分數,也稱為 t 值,是指與 t 分佈均值相差多少個標準差。t 分數是 t 檢驗和迴歸分析中使用的檢驗統計量。當資料服從 t 分佈時,它也可以用來表示觀察值距離均值的距離。

在 Python 中根據 t 分數計算 P 值

Python 中的 scipy.stats.t.sf() 函式具有以下語法,它可以用來獲取與給定 t 分數相對應的 p 值 -
scipy.stats.t.sf(abs(x), df)

其中 -

  • x - t 分數
  • df - 自由度

1. 左尾檢驗

假設我們希望獲取一個左尾假設檢驗的 p 值,其中 t 分數為 -
0.77 且 df = 15。

示例

!pip3 install scipy import scipy.stats #find p-value scipy.stats.t.sf(abs(-.77), df=15)

輸出

0.2266283049085413

使用 0.2266 的 p 值。由於此 p 值不小於 0.05,因此如果我們應用 = 0.05 的顯著性閾值,我們將無法拒絕假設檢驗的原假設。

2. 右尾檢驗

假設我們希望獲取一個右尾假設檢驗的 p 值,其中 t 分數為 1.87 且 df = 24。

示例

import scipy.stats #find p-value scipy.stats.t.sf(abs(1.87), df=24)

輸出

0.036865328383323424

p 值為 0.0368。由於此 p 值小於 0.05,因此如果我們應用 = 0.05 的顯著性閾值,我們將拒絕假設檢驗的原假設。

3. 雙尾檢驗

假設我們希望獲取一個雙尾假設檢驗的 p 值,其中 t 分數為 1.24 且 df = 22。

示例

import scipy.stats #find p-value for two-tailed test scipy.stats.t.sf(abs(1.24), df=22)*2

輸出

0.22803901531680093

p 值為 0.2280。由於此 p 值不小於 0.05,因此如果我們應用 = 0.05 的顯著性閾值,我們將無法拒絕假設檢驗的原假設。

結論

這裡討論了 P 值和 t 分數。這兩者都用於統計學中,從資料中獲取見解並幫助更準確地預測。此外,我們可以使用 Python 從 t 分數計算 P 值。

更新於: 2022-12-01

3K+ 次檢視

開啟您的 職業生涯

透過完成課程獲得認證

開始學習
廣告
© . All rights reserved.