心理學中零假設的意義與應用


當有人進行實驗時,他們需要一個工具來驗證其結果的相關性。零假設是我們在研究心理學中使用的工具之一。零假設 (H0) 假設兩種可能性相同,即觀察到的差異僅僅是由於偶然性造成的。然後,我們使用統計檢驗來確定零假設為真的可能性。

零假設

在統計檢驗中,零假設 (H0) 與備擇假設 (H1) 相比較,在此基礎上,我們拒絕或接受零假設。零假設和備擇假設都是對所研究總體統計模型的推測。而統計模型又是基於總體樣本建立的。這些檢驗在科學的各個領域都有應用,從粒子物理學到藥物開發。它們將實際結果與噪聲區分開來;有了它們,更容易進行正確的科學研究。

步驟

在統計顯著性檢驗中,被檢驗的陳述,即零假設,與備擇假設進行比較。該檢驗旨在評估反對零假設的證據強度。通常,零假設假設沒有差異。例如,如果我們比較不同地區(例如印度和荷蘭)女性的身高,零假設假設這兩個地區女性的平均身高相同。在統計顯著性檢驗中,我們從被研究的總體中抽取一個隨機樣本。我們假設零假設為真。我們計算如果真是如此,結果會是什麼樣子,然後我們將此與實際結果進行比較。如果觀察到的資料和理論資料之間的差異具有統計學意義,我們就拒絕零假設。

如果零假設為真,我們得到與樣本相同結果的機率稱為p值。找到p值對於檢驗零假設至關重要。如果p值很低,則在零假設為真的情況下,該結果不太可能出現,反之亦然。

結果意味著什麼?

即使我們未能排除零假設,也不意味著它是正確的,可能是測量有誤或樣本存在偏差。結果意味著沒有足夠的證據來拒絕零假設,這意味著更好的資料也可能無法拒絕零假設。

歷史背景

零假設顯著性檢驗是現代統計學中兩種強大但對立的思想學派融合的產物。費舍爾設計了一種從資料中生成顯著性水平的機制,但內曼和皮爾遜提出了一種嚴格的決策過程,用於確認或拒絕預先定義的假設。除了作為對貝葉斯主義的反應之外,零假設顯著性檢驗過程不受該時期第三個主要智力流的影響。

早期爭議:證據測量或錯誤率

在它們與現代NHST糾纏在一起之前,錯誤率的科學效用和p值的推定證據意義是有爭議的問題。費舍爾和內曼尤其進行了激烈的、常常是尖銳的辯論,並且從未調和他們不同的觀點。內曼-皮爾遜模型在理論上被認為是一致的,並在數理統計中被廣泛接受為“頻率論正統”。然而,理論上的清晰度似乎是以犧牲在實際科學工作中的有限價值為代價的。在無限重複試驗中報告錯誤率的決策標準的強調可能適用於工業環境中的質量控制。然而,正如費舍爾嘲諷地觀察到的那樣(Fisher 1955),它似乎與科學假設評估不太相關。

儘管費舍爾首先為他提出的“顯著性檢驗”提出了5%的“顯著性閾值”,但他最終反對內曼-皮爾遜基於預定義水平的二元選擇規則,強調這對於科學目的來說是幼稚的。因此,在後來的文章中,他建議應提供精確的p值作為反對H0的證據,而不是做出瞬間的拒絕選擇(Fisher 1956)。另一方面,p值的所謂“客觀”證據性質在早期就受到了質疑。費舍爾基於“歸納推理”對H0的試圖反駁通常被認為在邏輯上是錯誤的,特別是因為p值只檢驗一個假設並且基於尾部面積機率,這在早期就被認為是一個嚴重的缺陷。

侷限性

統計顯著性並不意味著實際意義。結果可能具有統計學意義,但毫無用處。例如,一種比安慰劑效果更好但價格昂貴的新藥,而其他更便宜的療法可能已經提供了類似的益處。因此,這個結果具有統計學意義,但沒有實際意義。我們也不能證明資料所暗示的零假設,因為這是迴圈推理,什麼也證明不了。

結論

幾乎所有實驗研究,如果不是全部的話,都包括零假設。使用置信區間直接評估樣本均值作為相應總體均值估計的優劣,是幾種零假設顯著性檢驗密集型科學中逐漸出現的一種替代方法,也是自然科學中常用的一種方法,以克服其侷限性。

更新於:2022-12-30

614 次瀏覽

啟動你的職業生涯

透過完成課程獲得認證

開始學習
廣告