- Python 資料科學教程
- Python 資料科學 - 首頁
- Python 資料科學 - 入門
- Python 資料科學 - 環境搭建
- Python 資料科學 - Pandas
- Python 資料科學 - NumPy
- Python 資料科學 - SciPy
- Python 資料科學 - Matplotlib
- Python 資料處理
- Python 資料操作
- Python 資料清洗
- Python 處理 CSV 資料
- Python 處理 JSON 資料
- Python 處理 XLS 資料
- Python 關係型資料庫
- Python NoSQL 資料庫
- Python 日期和時間
- Python 資料整理
- Python 資料聚合
- Python 讀取 HTML 頁面
- Python 處理非結構化資料
- Python 詞法分析
- Python 詞幹提取和詞形還原
- Python 資料視覺化
- Python 圖表屬性
- Python 圖表樣式
- Python 箱線圖
- Python 熱力圖
- Python 散點圖
- Python 氣泡圖
- Python 3D 圖表
- Python 時間序列
- Python 地理資料
- Python 圖資料
Python - P值
P值關乎假設的強度。我們基於某些統計模型建立假設,並使用P值比較模型的有效性。一種獲得P值的方法是使用T檢驗。
這是一個針對零假設的雙側檢驗,該零假設認為一組獨立觀測值“a”的期望值(均值)等於給定的總體均值popmean。讓我們考慮以下示例。
from scipy import stats rvs = stats.norm.rvs(loc = 5, scale = 10, size = (50,2)) print stats.ttest_1samp(rvs,5.0)
上述程式將生成以下輸出。
Ttest_1sampResult(statistic = array([-1.40184894, 2.70158009]), pvalue = array([ 0.16726344, 0.00945234]))
比較兩個樣本
在以下示例中,有兩個樣本,它們可能來自相同的分佈或不同的分佈,我們想要檢驗這些樣本是否具有相同的統計特性。
ttest_ind - 計算兩個獨立樣本得分的均值的T檢驗。這是一個針對零假設的雙側檢驗,該零假設認為兩個獨立樣本具有相同的平均值(期望值)。預設情況下,此檢驗假設總體具有相同的方差。
如果我們觀察到來自相同或不同總體的兩個獨立樣本,可以使用此檢驗。讓我們考慮以下示例。
from scipy import stats rvs1 = stats.norm.rvs(loc = 5,scale = 10,size = 500) rvs2 = stats.norm.rvs(loc = 5,scale = 10,size = 500) print stats.ttest_ind(rvs1,rvs2)
上述程式將生成以下輸出。
Ttest_indResult(statistic = -0.67406312233650278, pvalue = 0.50042727502272966)
您可以使用相同長度但均值不同的新陣列進行相同的測試。在loc中使用不同的值並進行相同的測試。
廣告