心理學中P值技術的應用
理解p值的一種方法是考慮在零假設為真的總體中發現隨機樣本中觀察到的差異或更極端差異的可能性。由於假設檢驗非常普遍,因此幾乎所有定量研究論文都包含p值。在詳細介紹之前,讓我們簡要討論一下假設檢驗。
假設檢驗
研究假設是基於理論或先前研究邏輯對研究結果的預測。最好的理論是明確而具體的,允許它們在沒有任何疑問的情況下被證明或證偽。因變數是用來檢驗假設的標準。提出可檢驗的假設有助於澄清關於特定研究問題的疑問。它迫使研究人員概述評估假設所需的確切資訊以及執行此操作的方法。
傳統上,在使用統計技術檢驗假設時,假設因變數的任何變化都是偶然造成的。這些過程確定看似存在的差異並非真實的可能性。因此,為了進行統計檢驗,假設必須以零假設的形式陳述(即,預測沒有差異)。當統計分析顯示因變數之間沒有差異的可能性很大時,接受零假設。當沒有實際差異的可能性很低時,零假設被推翻。
當研究假設得到證即時,這表明資料變化不能用巧合來解釋。此外,它表明假設提出的因果變數可能解釋了這些變化,但只要存在替代假設,它們並不一定會這樣做。因此,發展理論包括淘汰薄弱的假設,直到留下一個在反證嘗試下仍然成立的假設,而不是證明一個假設。
錯誤型別
在決定是否接受或拒絕統計假設時,可能會發生兩種型別的錯誤:I型錯誤和II型錯誤。I型或α錯誤是在因變數保持不變時拒絕零假設。II型或β錯誤發生在因變數發生變化時接受零假設。
顯著性水平
假設檢驗中I型錯誤的機率由選擇的顯著性水平決定,通常用α(或P臨界值α)表示,這是一個在資料收集之前選擇的機率值,範圍從0到1。最常見的α值為.05和.01,但研究人員也可能使用其他α值,因為他們會考慮I型和II型錯誤的後果。當α為.05時,在零假設為真時拒絕零假設的機率為5%,這被稱為I型錯誤。因此,α為.01意味著I型錯誤發生的機率為1%。α是拒絕H0的標準。
p值
在設定α值之後,研究人員會從他們將從中得出結論的總體中隨機選擇的樣本中收集資料。務必記住,H0是在資料收集之前設定的。使用來自此樣本的資訊計算感興趣的統計量。在H0為真的總體中,樣本統計量與假設總體引數之間觀察到的差異的可能性用於做出關於接受或拒絕H0的決定。
下一步是計算在H0為真的總體中從隨機樣本中獲得觀察到的或更極端差異的可能性。這種可能性被稱為p值或P計算值。如果p值小於α水平,則拒絕H0,當拒絕H0時,這被稱為統計顯著的結果。如果p值大於α水平,則H0不被推翻,這種選擇被稱為統計不顯著的結果。p值是使用抽樣分佈計算的,範圍從0到1,就像α和其他所有機率一樣。
歷史背景
p值首先由卡爾·皮爾遜在他的皮爾遜卡方檢驗中正式提出,使用卡方分佈並記作大寫P。卡方分佈的p值(對於不同的χ2值和自由度),現在記作P,在(Elderton 1902)中計算,並被收集。羅納德·費希爾普及了p值在統計學中的應用,它在費希爾的統計方法中起著核心作用。
示例
假設一位研究人員擲一對骰子一次,並假設骰子是公平的。檢驗統計量是單尾的,是“擲出的數字的總和”。研究人員擲骰子,注意到兩個骰子的值都是6,導致檢驗統計量為12。這個結果的p值為1/36,大約為0.028(36個可能結果中最高的檢驗統計量)。如果研究人員使用0.05的顯著性閾值,則此結果將被認為是顯著的,並且骰子是公平的假設將被拒絕。在這種情況下,單次擲骰為得出關於骰子的重要結論提供了非常薄弱的基礎(證據不足)。這說明了在不考慮實驗設計的情況下應用p值的風險。
結論
由於在應用環境中假設檢驗的目的可能很複雜,因此定量結果經常需要解釋。對假設檢驗的部分理解可能會導致系統性問題,從而影響研究報告的質量。理解假設檢驗和p值並謹慎使用它們對於高質量的研究報告至關重要。
資料結構
網路
關係資料庫管理系統 (RDBMS)
作業系統
Java
iOS
HTML
CSS
Android
Python
C語言程式設計
C++
C#
MongoDB
MySQL
Javascript
PHP