卡方檢驗在心理學中的應用
卡爾·皮爾遜於 1900 年提出了卡方 (X2) 檢驗,這一發展常常被認為是統計學領域最重大的創新之一。在心理學研究中,該檢驗及其所基於的統計分佈有著廣泛的應用。其兩個主要應用是:評估理論模型或一組先驗機率與一組資料的擬合程度,以及檢驗兩個變數的獨立性。卡方檢驗涉及觀察頻率 (O) 和預期頻率 (E),而預期頻率可以透過理論或經驗研究來確定。
卡方檢驗
當檢驗統計量在零假設下服從卡方分佈時,就會進行卡方檢驗。使用該檢驗分析的資料是多元的。例如,如果我們想了解植物 A 和植物 B 在兩種不同的肥料組合下的表現,我們將使用卡方檢驗。
這是一種非引數方法,用於確定兩個名義變數或有序變數之間是否存在統計學意義上的關係。卡方檢驗只能報告樣本中各組在某些測量的屬性或行為上是否存在顯著差異;它不允許從樣本推斷到其來源的總體,因為它分析的資料比引數檢驗(如 t 檢驗和方差分析 (ANOVA))更粗略。然而,由於卡方檢驗對資料的要求“較低”,因此它可以應用於各種研究情境。
步驟
資料被分類成互斥的類別。如果不存在差異的零假設為真,則觀察結果將遵循卡方分佈。該檢驗評估如果零假設為真,觀察到的值的可能性有多大。
如果觀察結果是獨立的,則觀察結果將遵循卡方分佈,並且當樣本量增加時,分佈將更接近卡方分佈。
卡方分佈是連續的,但卡方檢驗用於離散值。因此,為了解釋小樣本量資料中的誤差,卡方檢驗應用了 Yates 校正,儘管近年來對其必要性提出了質疑。
零假設下的卡方檢驗
假設我們從某個實驗中獲得了一組觀察頻率,並希望瞭解這些資料是否支援某個特定的假設或理論。卡爾·皮爾遜在 1990 年建立了一個檢驗,以評估實驗值與根據某些理論或假設獲得的理論值之間差異的重要性。這個檢驗稱為 2 檢驗,用於確定觀察值(實驗)與理論值或假設值之間的差異是否可以歸因於偶然性(抽樣波動),或者是由理論無法匹配觀察資料造成的。零假設指出觀察值(實驗)與理論值或假設值之間沒有顯著差異,這意味著理論與實驗是一致的。
卡方檢驗的要求
卡方檢驗是一種統計顯著性檢驗,它將樣本中測量的兩個變數的觀察頻率與在兩個變數之間不存在關係的情況下預期的頻率進行對比。換句話說,卡方檢驗確定實際結果與零假設的差異是否足夠大,以至於超過了它們可能是隨機機會、抽樣誤差或兩者兼而有之的結果的可能性。
卡方檢驗依賴於一個較弱的假設,即每個變數的值在其樣本所來自的總體中呈正態分佈。然而,與 t 檢驗等引數檢驗不同,它不要求樣本資料處於區間測量水平或大致呈正態分佈。但是,卡方檢驗也有一些前提條件。
在檢驗名義變數和有序變數之間的關係時,卡方檢驗是最佳工具。名義變數(如性別)根據互斥的、不相關的類別來描述屬性。有序變數測量的是主體可能或多或少具有的特徵,但不能在尺度上以相等的步長進行測量(例如,軍銜)。
樣本必須從總體中隨機抽取。
必須使用原始頻率來報告資料,而不是例如百分比。
被測量的變數必須彼此無關。每個變數對於每個觀察結果只能有一個類別或值,並且任何類別都不能本質上依賴於或受任何其他類別影響。
獨立變數和因變數上的值和類別必須是窮舉的和互斥的。在鞋類統計中,每個受試者只計算一次,具體取決於他們是否喜歡涼鞋、運動鞋、皮鞋、靴子或其他型別的鞋類,以及他們是否被認定為男性或女性。某些變數可能不需要“其他”類別,但“其他”通常確保變數已得到完全分類。(某些分析可能需要“無法確定”類別。)無論如何,必須包含整個樣本的結果。
獨立性卡方檢驗
請記住,定性資料是指您收集有關人員的資訊,這些資訊被組織成類別或名稱。然後,您將統計有多少人擁有某些特徵。例如,有一種假設認為母乳餵養與自閉症之間存在關聯。為了檢驗是否存在關聯,研究人員可能會收集有關女性母乳餵養孩子的時間長短以及該孩子是否被診斷出自閉症的資料。然後,這些資訊將儲存在表格中。您將想知道每個單元格是否獨立於其他單元格。請記住,獨立性是指一個事件不會影響另一個事件。這意味著患有自閉症與母乳餵養無關。您想知道的是它們是否獨立。換句話說,一個如何影響另一個?如果您要進行假設檢驗,這將是您的備擇假設,而零假設則是它們是獨立的。獨立性卡方檢驗就是針對這種情況的假設檢驗。
擬合優度卡方檢驗
您使用實驗方法和理論方法來估計機率中的機率。通常需要確定實驗值與理論值之間的匹配程度。例如,假設您想檢視骰子是否公平。為了檢視觀察值是否與預期值匹配,請檢查觀察值與預期值之間的差異是否足夠大,以至於可以得出結論:如果觀察值與預期值匹配,則檢驗統計量不太可能發生。在這種情況下,檢驗統計量也是卡方。該步驟與獨立性卡方檢驗相同。
結論
預期(和觀察到的)頻率必須合理。卡方檢驗基於一個假設,即任何類別內的樣本頻率在預測的總體值周圍呈正態分佈。當預期的總體值接近於零時,分佈不可能是正態的,因為出現的頻率不能為負。當預期頻率較大時,正態分佈的假設是有效的,但隨著預期頻率的減少,卡方檢驗結果的有效性也會降低。表格中的任何單元格都不能觀察到原始頻率為零,因為某些卡方數學公式需要除法。