心理測試中適當規範的必要性
從事研究或其他學術調查的人員致力於測量一個概念,然後將其結果推廣到整個人群。但是,這項看似不可能的任務是如何實現的呢?個體差異構成了心理學的核心。在心理學中,我們努力弄清人們的不同之處,同時找出他們的一些共同點。我們在心理學中以系統和科學的方式研究行為。此外,行為是根據其表現來研究的。
心理測試中適當規範的必要性
規範是指個體在特定指標上的表現與特定基準的總體表現相比的情況的細節。規範指的是標準化測試結果。分析心理測試結果最常見的方法是與規範進行比較,這顯示了測試在標準化樣本中的表現如何。規範象徵著在所有情況下最高的績效。18 世紀,弗朗西斯·高爾頓爵士首次提出了基於規範的評估的原理。
使能夠評估測試相對受試者位置的事實被稱為測試規範。例如,與評分關鍵相符的響應百分比是受試者原始分數的度量,但此數字毫無意義。測試結果幾乎總是必須被解讀為揭示受試者與其他組成員的立場。規範為我們將一個人與一個群體進行比較提供了一個框架。規範有兩個目的
規範指示個體在規範樣本中的相對位置,這使得能夠將個體的表現與其他人進行比較。
規範提供可比較的測量,使可以直接比較個體在不同測試上的成就。
統計規範在心理測試中的重要性
它可以在以下標題下進行研究:
頻率分佈
統計技術的主要目標是組織和總結定量資料,以便於理解。列出 1000 個發現可能會令人望而生畏,這就是溝通的意義很小的地方。透過將結果製表成頻率分佈,可以採取第一步來恢復這種混亂的原始資料的結構。透過將分數分成易於管理的類別區間並計算每個區間中的每個分數來建立分佈。
一旦所有結果都記錄下來,就對計數進行彙總以確定每個類別區間內的頻率或例項數。組中的例項總數 N 將等於這些頻率的總和。
圖形表示
分散曲線可以圖形化地描述頻率分佈中的資料。分數按閾值或水平軸上的類別區間組織,頻率或每個類別區間中的例項數放在垂直軸上。該圖有兩個不同的圖。
直方圖中疊加在該區間上的列的高度表示每個類別區間中得分的人數。在頻率多邊形中,一個點位於類別區間的中心,直接與相關頻率相對,表示每個區間中的人數。然後繪製線以連線後續的點。
集中趨勢
一組值可以根據任何集中趨勢度量進行分類。平均值或平均值 (M) 是這些度量中最常用的,它是透過將所有分數加起來並將其總數除以例項數 (N) 來計算的。眾數或最常見的分數是另一個度量。
在頻率分佈中,眾數是指具有最高頻率的指定範圍的中間點。當所有分數按大小順序排列時,中位數或中間分數是集中趨勢的第三個指標。一半的案例位於中位數之上和之下,中位數將分佈分成兩半。
變異性
方差的測量值,或圍繞集中趨勢的個體差異的大小,用於徹底描述一組測試結果。以最佳值和最低值之間的差異來顯示變異性代表了最透明和最眾所周知的方法。然而,範圍僅由兩個分數定義,使其極其不穩定和原始。這意味著單個異常大的結果或不良結果會顯著改變其大小。每個人得分與組平均值之間的差異,是變異性的更準確衡量標準。
發展規範
它包括:
心理年齡
提供有意義的測試結果的一種方法是顯示該人在典型的發育軌跡中取得了多大的進步。發展系統在執行特定任務(例如感知操作或概念形成)時使用更多對行為的定性描述。儘管比內本人更喜歡更不帶偏見的詞“智力水平”,但“心理年齡”一詞卻透過比內-西蒙量表的替代含義和解釋而被普遍使用。
專案組基於像 Bind 及其更新(1986 年之前)這樣的年齡量表中的年份。例如,標準化樣本中大多數 7 歲參與者透過的專案被歸類為 7 歲類別,依此類推。因此,孩子的測試結果將表明他們可以達到的最高年級。在實際應用中,這個人未能透過某些低於其心理成熟度的測試,並在某些高於其心理成熟度的測試中成功。因此,通常的做法是確定基礎年齡,即透過所有考試的年齡。
隨後,以月為單位對在更高年齡等級達到的所有評估給予部分學分,這些學分隨後新增到此基礎年齡中。心理年齡標準也已用於未按年級劃分的評估。在這種情況下,首先計算孩子的原始分數。
此類測試的成熟度規範是標準化樣本中每個年齡類別內的兒童獲得的平均定量證據。例如,如果根據 8 歲兒童的平均測試統計資料,某人的評估心理成熟度為 8 歲。透過使用年齡規範,可以類似地處理任何原始測試分數。
年級等值
學術成績考試中的分數通常轉換為年級等值。計算每個年級學生獲得的平均原始分數以確定年級規範。因此,如果標準化樣本中四年級學生的數學測試中正確解答問題的平均數為 23,則原始分數 23 等同於 4 年級。
插值通常用於確定中間年級等值,表示分數的幾分之一。同時,也可以透過在學年中的不同時間點評估學生來直接獲得這些結果。例如,四年級開始時的平均成績為 4.0。如果測試使用者需要清楚地記住年級規範是如何確定的,他們也可能會誤解。
序數測量
他們透過特定的行為功能來確定孩子的發育階段。即使分數可能以大致的年齡範圍提供,但首先是對孩子的特徵和行為的描述性設計。此類量表通常暗示透過一系列階段進行統一的發展演變。這些量表與域參照評估共享重要特徵,因為它們通常提供有關兒童完全能夠做什麼的詳細資訊(例如,無需支撐即可攀爬坡道;在將液體澆入不同大小的容器時識別液體的體積差異)。
適當的規範告訴我們什麼?
它包括:
個體與同一類別中其他人的相對錶現
比較標準
一種評估自我並提供改進方法的方式
為相同人口統計特徵的個人設定理想化的目標
在高風險測試決策中的測試公平性
根據證據進行預測
對獲得的測試分數進行有意義的解釋
結論
測試“常模”是提供給隨後將進行相同評估的相關學習者樣本的標準化考試結果。常模為教師提供了一種工具,可以瞭解學生在特定年級的正常(或平均)成績。此外,常模還顯示與每個分數相關的百分位等級以及每個年級所有潛在測試分數的範圍。常模揭示了所有學生在考試中的相對成績,無論他們的成績是低、中還是高。在這種特定情況下,教師可以使用常模來確定每個學生的勝任力水平與其他學生相比,並確定哪些學生需要補習、標準或加速教學。