心理學測驗題目的編寫

心理學測驗題目在評估個體的智力、情緒和人格方面至關重要。它們被用於各種情境，例如教育評估、臨床評估和研究。測驗題目能夠對個體進行客觀測量，並有助於識別群體內部的模式和趨勢，以及根據不同特徵比較群體。它們還有助於確定干預措施或治療的有效性。然而，為了確保測驗題目的效度和信度，必須考慮題型、作答選項和評分方法。

題型

您在課堂上最可能遇到的考試型別是，對於每個測驗題目，您都會因為提供特定答案或選擇一個“正確”選項而獲得分數。這種方法用於是非題和選擇題考試。類似的格式用於各種其他目的，包括評估態度、測試對交通規則的理解，以及識別某人是否具有與特定健康狀況相關的特徵。這種型別最基本的測驗具有二分法題型。

二分法題型

二分法題型為每個題目提供兩個選項，通常選擇其中一個選項即可獲得分數。是非題是最典型的例子。這種測驗要求學生回答一系列陳述，學生的任務是確定哪些命題是正確的，哪些是不正確的。是非題有很多優點，包括編制和評分簡單。然而，它也越來越受歡迎，因為教師可以透過從教科書中複製句子來快速構建測驗。逐字複製的句子被標記為“正確”。其他陳述則被修改，使其不再成立。

是非題有幾個優點，包括其明顯的簡單性、管理的便利性和快速評分。另一個吸引人的方面是非題需要絕對判斷，並且考試者必須選擇兩個選項之一。但是，也有一些缺點。

例如，是非題會促使學生死記硬背內容，讓他們在包含他們不完全理解的主題的考試中獲得高分。此外，“真理”通常存在灰色地帶，而是非題不允許考試者展示他們對這種複雜性的理解。此外，獲得任何題目正確答案的可能性是 50%。因此，為了保證信度，是非題必須包含大量題目。總的來說，二分法題目的信度和準確性低於其他題型。

在教育評估中，二分法題型不僅以是非題的形式出現。許多人格測試需要是非題或其他兩選項的回答，例如是/否。

人格測試建立者經常偏愛這種風格，因為它需要完全的判斷。例如，人們在回答“我經常擔心我的效能力”這樣的問題時不能模稜兩可；他們必須回答“正確”或“錯誤”。對於具有多個分量表的人格測試，二分法題型提供了顯著的優勢。一個優點是它們使分量表的評分變得簡單。測試人員只需統計一個人認可的每個分量表中有多少題目即可。

多項選擇題型

多項選擇題型與二分法題型類似，區別在於每個題目包含兩個以上的選項。通常，選擇其中一個選項即可獲得分數，選擇其他任何選項均不得分。選擇題是您最常看到的題型，因為它是在大型課程中評估學習成就的常用方法。

選擇題評分簡單，並且透過偶然機會獲得正確答案的可能性低於是非題。由於考試者無需書寫，因此這種格式具有顯著的優勢，因為它需要最少的時間才能對特定題目做出反應。因此，考試可以在很短的時間內涵蓋大量資訊。

首先，考試應該包含多少個干擾項？根據心理測量理論，引入更多幹擾項應該會提高題目的信度。然而，在現實中，增加干擾項可能不會提高信度，因為好的干擾項很難找到。沒有人會選擇的干擾項不會提高題目的信度。根據研究，很少能找到包含三個或四個以上有效干擾項的題目。

無效的干擾項會降低測驗的信度，因為它們需要時間閱讀，並且限制了可以在測驗中包含的優質題目的數量。根據對選擇干擾項相關問題的評估，通常建議為每個題目設定三個或四個合適的干擾項。精心挑選的干擾項是優質題目的關鍵組成部分。

心理測量分析有時可以為更簡單的考試鋪平道路。例如，大多數選擇題考試都建議四個或五個答案。然而，這種慣用方法可能不是資源的最佳利用方式。在一項針對初級警官入學考試的評估中，應聘者完成了包含五個備選項的選擇題或三個備選項的選擇題的測試電池。

心理測量研究表明，兩種型別的考試的效度和信度大致相似。這一發現意味著，在心理測量價值方面，三個備選項的選擇題可能優於五個備選項，同時準備和管理時間更短。對 80 多年心理測量研究的審查證實，包含三個選項的題目與包含三個以上選項的題目一樣好，甚至更好。

李克特量表題型

態度和人格測量的一種常見結構是要求受訪者表達他們對特定態度問題的同意程度。這種方法被稱為李克特量表題型，因為它被用作李克特（1932 年）建立態度量表方法的一部分。李克特量表上的題目包括諸如“我害怕高處”之類的短語。除了是/否回答外，還提供了五個選項：強烈不同意、不同意、中立、同意和強烈同意。

在某些應用中使用六個備選項是為了避免讓回答保持中立。可能的回答包括強烈不同意、中等不同意、輕微不同意、輕微同意、中等同意和強烈同意。在對回答進行彙總之前，必須對任何措辭負面的題目進行反向評分。這種方法在測量態度方面尤其受歡迎。例如，它使學者能夠確定人們對諸如“政府不應控制私營企業”之類的陳述的同意程度。

由於李克特量表題型的回答可以提交給因子分析，因此測試開發人員可以識別出一組相關的題目。李克特量表通常使用李克特量表題型建立。這些量表需要檢查題目的區分度，我們將在本章後面討論這一點。開發李克特量表有幾種技術方法。

根據一些研究，強制選擇題型的效度優於傳統的李克特量表題型。對於測量複雜的應對反應，一些研究表明，李克特量表題型優於視覺模擬量表等方法。其他人則質疑使用典型引數統計來評估李克特量表題型的回答，因為資料是有序資料而不是區間資料。儘管如此，李克特量表題型廣為人知且易於使用，並且它很可能在人格和態度測試中繼續流行。

分類題型

分類題型是一種類似於李克特量表題型的策略，但具有更多選項。大多數人都知道 10 分制評分系統，因為我們經常被問到諸如“在 1 到 10 的範圍內，1 表示最不漂亮，10 表示最漂亮，您如何評價您新伴侶的吸引力？”醫生經常要求他們的病人評估他們的疼痛程度，範圍從 1 到 10，1 表示沒有疼痛，10 表示無法忍受。分類量表不必正好有 10 個點；它可以有更多或更少的類別。

實驗表明，如果量表的端點定義明確，並且受試者始終了解端點定義，則可以避免此問題。例如，測試人員可以向教練展示一些影片，這些影片展示了被評為 10 分的籃球運動員的表現，以及其他一些影片，展示了 1 分意味著什麼，而不是要求教練在 10 分制上給籃球運動員評分。在這種情況下，受訪者不太可能以受群體中其他刺激影響的方式做出反應。

清單和 Q 分類

形容詞清單是人格評估中的一種常見格式。一個人會收到一份很長的形容詞列表，並被要求指出每個形容詞是否描述了他或她自己。形容詞清單可以用來描述自己或其他人。例如，在加州大學伯克利分校的一項研究中，評分者驗證了他們認為區分了 40 名研究生群體的特徵。

其中一半的學生被他們的教授評為創造力非凡，而另一半則被評為創造力低下。結果表明，用於描述這兩組成員的形容詞有所不同。用於描述高創造力學生的形容詞最常見的是：冒險、專注、感興趣、冷靜、有創意和公平。另一方面，低創造力的學生被認為是困惑的、傳統的、防禦性的、有禮貌的、有偏見的和易受暗示的。

形容詞清單迫使人們批准或拒絕這些形容詞，導致每個專案只有兩個選項。Q 分類法是一種相關的方法，它增加了類別的數量。Q 分類法可以用來描述你自己或評價他人。使用這種方法，受試者會得到一些陳述，並被指示將其排列成九堆。

結論

根據以上發現，心理學家使用測試專案來評估人們的心理能力、情緒和性格。它們被應用於各種環境中，包括研究、臨床評估和教育評估。測試專案使客觀地衡量人們成為可能，並有助於觀察群體內部的模式和趨勢，以及基於各種特徵進行對比分組。它們還有助於確定干預措施或治療的有效性。

然而，必須考慮測試專案的格式、反應選擇和評分程式，以確保其有效性和可靠性。心理評估是評估心理表現的許多方面的寶貴方法，例如認知能力、人格特質和情緒狀態。它們被應用於各種環境中，例如研究、臨床評估和教育測試。

Utkarsh Shukla

更新於： 2023年2月13日

818 次瀏覽

開啟你的職業生涯

透過完成課程獲得認證

開始