Python - P值

P值關乎假設的強度。我們基於某些統計模型建立假設，並使用P值比較模型的有效性。一種獲得P值的方法是使用T檢驗。

這是一個針對零假設的雙側檢驗，該零假設認為一組獨立觀測值“a”的期望值（均值）等於給定的總體均值popmean。讓我們考慮以下示例。

from scipy import stats
rvs = stats.norm.rvs(loc = 5, scale = 10, size = (50,2))
print stats.ttest_1samp(rvs,5.0)

上述程式將生成以下輸出。

Ttest_1sampResult(statistic = array([-1.40184894, 2.70158009]),
pvalue = array([ 0.16726344, 0.00945234]))

比較兩個樣本

在以下示例中，有兩個樣本，它們可能來自相同的分佈或不同的分佈，我們想要檢驗這些樣本是否具有相同的統計特性。

ttest_ind - 計算兩個獨立樣本得分的均值的T檢驗。這是一個針對零假設的雙側檢驗，該零假設認為兩個獨立樣本具有相同的平均值（期望值）。預設情況下，此檢驗假設總體具有相同的方差。

如果我們觀察到來自相同或不同總體的兩個獨立樣本，可以使用此檢驗。讓我們考慮以下示例。

from scipy import stats
rvs1 = stats.norm.rvs(loc = 5,scale = 10,size = 500)
rvs2 = stats.norm.rvs(loc = 5,scale = 10,size = 500)
print stats.ttest_ind(rvs1,rvs2)

上述程式將生成以下輸出。

Ttest_indResult(statistic = -0.67406312233650278, pvalue = 0.50042727502272966)

您可以使用相同長度但均值不同的新陣列進行相同的測試。在loc中使用不同的值並進行相同的測試。

列印頁面