效度型別

效度可能是測試質量最重要的標準。效度一詞指的是測試衡量其聲稱評估內容的能力。高效度測試中的專案將與考試的預期重點密切相關。這意味著許多認證和許可考試將與特定工作或職業密切相關。當測試缺乏效度時，它未能評估它應該評估的與工作相關的材料和能力。在這種情況下，沒有必要將測試結果用於其預期目的。

效度型別

效度有四種類型 -

內容效度
效標關聯效度（進一步細分為）
- 同時效度
- 預測效度
構念效度（進一步細分為）
- 收斂效度
- 區分效度
表面效度

這些將在下面討論 -

內容效度

McBurney 和 White（2007）將內容效度定義為測試應該對被測理論概念所代表的行為範圍進行抽樣的理念。這是一種非統計型別的效度，它涉及評估測試的內容以檢視它是否包含被評估行為的典型樣本。具有內容效度的測試中的專案表明瞭考試應該涵蓋的所有可能的專案範圍。例如，如果一位研究人員想要為三年級學生建立一項拼寫成就測試，他或她可能會列出三年級學生應該知道的所有單詞。

可以從大量物件中選擇單個測試專案，包括各種商品。內容效度被整合到測試中。在徹底審查主題內容後，根據專案與測試標準的相容性選擇專案。在某些情況下，如果測試評估難以定義的屬性，專家可以對專案的相關性進行評分。由於每個評判者對他們的評估都有自己的看法，因此考試將由兩位獨立的評判者分別進行評分。兩位評判者都認為非常重要的專案將包含在最終考試中。

效標關聯效度

效標關聯效度的概念指出，有效的測試應該與同一理論概念的其他衡量標準密切相關。一個好的智力測試應該與其他智力測試有很強的相關性。如果測試顯示出成功的預測標準或構念指標，則稱其具有效標關聯效度。效標效度有兩種型別。

同時效度 - 當標準測量和測試分數同時達到時，就會發生這種情況。它表示測試結果估計個人當前標準狀況的程度。例如，如果一項測試評估焦慮，如果它準確地反映了個體的當前焦慮程度，則認為它具有同時效度。同時效度證據通常適用於成就測試和臨床診斷測試。
預測效度 - 當標準測量在測試後收集時，就會出現預測效度。例如，能力傾向測試可以幫助確定誰更有可能在特定主題上成功或失敗。預測效度是入學考試和職業測試的重要方面。

構念效度

構念效度方法比其他型別的效度更復雜。McBurney 和 White（2007）將構念效度定義為測試的屬性，其中測量真正衡量了旨在測量的構念。有許多方法可以確定測試是否產生構念有效的資料。

測試應該以相同的方式衡量正在測試的理論概念。例如，領導能力傾向測試不應真正評估外向性。
構念效度方法比其他型別的效度更復雜。McBurney 和 White（2007）將構念效度定義為測試的質量，即測量真正衡量了它應該評估的構念。
有各種方法可以確定測試是否生成具有構念效度的資料。測試應該真正評估正在測試的理論概念，而不是其他任何東西。例如，領導能力測試不應真正評估外向性。

構念效度有兩種型別 -

收斂效度 - 它意味著衡量標準與理論上預測相關的另一衡量標準的相關程度。
區分效度 - 這解釋了操作化與理論上不應該相關的其他操作化的相關程度。

表面效度

表面效度是指表面上似乎測量的什麼。這取決於研究人員的自由裁量權。檢查每個問題並進行調整，直到研究人員滿意它準確地測量了預期的構念。研究人員的主觀判斷用於確定表面效度。

效度的方面

效度有兩個不同的方面：內部和外部。

內部效度

內部效度是最基本的一種效度，因為它涉及自變數和因變數之間關係的邏輯。基於測量和研究方法，這種效度估計可以推斷因果關係的程度。設計良好的實驗方法，在受控良好的環境下檢查自變數對因變數的影響，提供了更高程度的內部效度。

對內部效度的威脅 - 對內部效度存在多種威脅。其中一些是 -

混淆 - 當實驗中兩個變數的影響無法分離時，就會出現混淆錯誤，導致對結果的解釋混亂。混淆是對實驗效度最嚴重的威脅之一。如果實驗者無法控制自變數，混淆尤其成問題。當參與者根據是否存在某種條件進行選擇時，受試者變數可能會影響結果。可能會形成與原始原因和推論假設相競爭的假設，其中無法避免誤導性聯絡。
選擇偏差 - 組選擇中的任何偏差都可能危及內部效度。選擇偏差表示由組間測試前差異引起的問題，這些差異可能與自變數相互作用，從而影響觀察到的結果並導致問題；例如，性別、個性、心理和身體能力、動機水平和參與意願。
歷史 - 實驗外部或因變數重複評估之間發生的事件，例如自然災害或政治變化，可能會影響參與者在實驗過程中的反應、態度和行為。在這種情況下，很難判斷因變數的變化是由於自變數還是歷史事件造成的。
成熟 - 參與者在實驗過程中或測量之間發生變化是很常見的。例如，在縱向研究中，幼兒可能會因其可衡量的經驗、能力或態度而成熟。永久性變化（例如身體發育）和短暫性變化（例如疲勞和疾病）會影響一個人對自變數的反應方式。因此，研究人員可能難以確定變化是由於時間還是其他變數造成的。
頻繁測試 - 由於重複測試，參與者可能會產生偏差。參與者可能會回憶起正確的答案或由於測試的重複交付而受到條件影響。此外，它增加了對內部效度構成威脅的可能性。儀器更換/更改：如果在實驗過程中更換/更改任何儀器，它可能會影響內部效度，因為很容易獲得替代解釋。

外部效度

根據 McBurney 和 White（2007）的說法，外部效度關係到研究結果是否可以推廣到另一個背景、新的參與者、地點、時間範圍等。使用人類參與者的實驗通常使用來自特定地理區域或具有獨特特徵的小樣本，從而降低了外部效度（例如，志願者）。因此，無法確保關於因果關係的發現與不同地理區域的人或缺乏這些特徵的人相關。

對外部效度的威脅 - 外部效度的一個主要問題是如何在形成概括時可能需要進行校正。通常，當原因（即自變數）依賴於其他因素時，概括受到限制；因此，所有外部效度風險都與自變數相互作用。

能力-處理互動 - 樣本可能包含與自變數相互作用的特徵，從而限制了普遍性；例如，從比較心理治療研究中得出的結論通常使用特定樣本（例如，志願者、高度抑鬱、重刑犯）。
情況 - 所有情境特徵，例如治療條件、光線、噪音、地點、實驗者、時間、範圍和測量程度等，都可能限制概括。
測試前效應 - 當因果關係只能在測試前發現時，結果的普遍性也受到限制。
測試後效應 - 當因果關係只能在測試後完成時進行研究，這可能會進一步限制結果的普遍性。
羅森塔爾效應 - 當來自因果關係的推論不能推廣到其他調查人員或研究人員時。

結論

內容效度決定了一個問題、任務或測試專案在多大程度上代表了測試旨在抽樣的行為總體。如果測試對測試使用者、考試人員以及最重要的是考生而言似乎有效，則該測試具有表面效度。當測試預測可接受的結果測量的表現時，它就體現了效標關聯效度。當自變數和因變數之間存在因果關係時，就會產生內部效度。當實驗中兩個自變數的影響無法獨立分析時，就會出現混淆。外部效度關注的是研究結果是否可以應用於新的情況：不同的參與者、地點、時間等等。

Utkarsh Shukla

更新於： 2023年2月9日

4K+ 瀏覽量

開啟你的職業生涯

透過完成課程獲得認證

開始學習