計算機輔助評估

計算機輔助測試的支持者認為，它使記錄歌曲作者和導師的分數更容易得多。此外，經常參加這些考試的個人可以立即檢視他們的分數。然而，一些批評者仍然認為，具有不同閱讀和資訊處理方式的人可能會發現計算機測試比較困難。

計算機輔助評估

計算機輔助測試是一種評估模型，其中考生或測試者回答計算機程式一部分的問題或完成練習。在許多情況下，計算機測試還包括自動評分。當存在有限數量的正確答案時，就會發生這種情況，例如多項選擇測試模型。例如，當簡答題和論文題包含在計算機輔助測試中時，評分者會閱讀答案並將分數輸入資料庫。計算機輔助測試用於標準化測試以及課堂上的心理和技能評估，也可能被希望自我測試的個人使用。

計算機輔助評估的歷史發展

計算機化測試方法長期以來一直對提供心理評估服務非常重要。自從計算機在20世紀50年代首次被引入並應用於評估心理學領域以來，它們一直是評分、資料處理和解釋測試結果的寶貴工具。本文總結了基於計算機的人格和神經心理學測試的歷史和現狀。文章強調了計算機提供測試解釋中涉及的幾個實際問題。

介紹了計算機輔助測試使用的進展，例如自適應測試，並指出了存在的問題。目前，人們非常有興趣擴充套件網際網路上心理評估服務的可用性。雖然這些服務顯示出巨大的潛力，但與在網際網路上提供心理測試相關的幾個問題需要心理學家在網際網路成為心理服務提供的主要媒介之前予以解決。

計算機輔助評估的優勢

與臨床醫生推斷的估計相比，計算機化評估之所以能夠取得最近的增長和現狀，很大程度上要歸功於計算機為心理評估任務提供的獨特優勢。

計算機具有時間和成本效益。自動化報告可以在測試完成後的短時間內提供，從而節省寶貴的專業時間。
使用計算機進行心理評估的另一個優勢在於其評分的準確性，因為在評分時，計算機不太容易出現人為錯誤。
第三，計算機透過最大限度地減少對資料進行主觀解釋的可能性，提供了更客觀和更不偏頗的解釋。
自動化報告的第四個優勢是，它們通常比臨床醫生的報告更全面。測試者的概況與自動化解釋中的許多其他概況進行比較。因此，測試資訊可以更直接地用於對受試者進行分類，同時描述具有相似概況的人的行為、行為和學習。總之，經過精心設計的測試結果和輔助資訊的統計處理將比使用相同資訊的個人專業人員得出更有效的結論。
最後，自動化測試管理對某些受試者來說可能更有趣，他們也可能覺得對計算機評估者的反應比紙筆測試的特殊不同環境更不焦慮。

計算機輔助評估的劣勢

雖然自動化評估的優勢很多，但該系統並非完全沒有問題。

與自動化管理、評分和解釋相關的一個主要問題是，缺乏資質的專業人員濫用。自動化評估可能會鼓勵那些缺乏足夠知識和經驗的專業人員使用。重要的是要記住，只有在具有足夠培訓和經驗的專業人員手中，才能保證透過自動化心理評估獲得的資訊的有效性。
計算機輔助評估的另一個風險是，心理健康專業人員可能會過度依賴計算機報告，從而減少他們親自解釋測試資料的積極性。此外，自動化報告不能替代重要的臨床觀察，這些觀察提供了與正式測試結果相結合的基本資訊。
第三個問題源於這樣一種錯誤觀念，即計算機生成的評估會產生不可避免的事實資訊。不能認為計算機評估會產生不能質疑的精確的科學陳述。基於計算機的結論並非一成不變，對這種解釋進行批判性審查對於其可靠使用是必要的。
第四，計算機報告中的計算機陳述可能會提供關於測試者對個人目的有用的模糊資訊。將臨床意見建立在這種型別的陳述上可能會導致不準確的建議。
最後，自動化報告可能包含不適用於所有情況的陳述。重要的是要記住，計算機報告是對概況的總體描述，而具有相似概況的個體只會保留特定概況關聯的某些特徵。專業人員必須確定每個客戶對測試報告的具體情況。

計算機輔助心理評估的過程

計算機輔助評估和心理療法已被證明對來自不同樣本、國家和呈現問題的大學生有效。目前可用的數字技術可以解決這些心理健康服務提供方面的挑戰，例如有限的人力資源、學生尋求幫助的失敗、尋求幫助的學生的汙名化、過早終止、低效流程和結果資料來評估和促進治療效果，以及缺乏基於即時資料的治療選擇。

基於計算機的心理評估自40多年前開始發展以來已經取得了長足的進步。許多解釋者使用計算機評分和基於計算機的解釋，並將基於計算機的測試解釋視為一種專業的、符合倫理的努力。自動化方法的應用在範圍和深度上都得到了擴充套件。然而，計算機技術和心理測試解釋的結合並非一種完美的關係。以往在自動化評估方面的努力需要進一步努力，以充分利用計算機的靈活性與能力來做出複雜的判斷。自動化操作在某種程度上受到現有心理專業知識和心理技術的限制。

迄今為止，基於計算機的關係僅限於書面材料。它們沒有考慮諸如關鍵語言線索（例如，言語模式、口語語調和麵部表情）之類的潛在寶貴資訊。研究支援了這樣一種觀點，即計算機管理的測試與紙筆管理的工具是不同的。因此，研究得出結論，計算機生成的報告應被視為臨床判斷的寶貴補充，而不是專業臨床醫生的替代品。儘管存在一些侷限性和未實現的潛力，但基於計算機的心理評估是一項非常成功的嘗試。關鍵詞：自適應測試；基於計算機的專案管理；基於計算機的測試解釋（CBTI）；自動化評估；基於網際網路的測試操作；明尼蘇達報告；MMI-2。

計算機自適應測試

計算機自適應測試 (CAT) 針對每個人的能力水平量身定製。“自適應測試試圖模仿一位知識淵博的考官的考試策略……如果一位考官提出一個對考生來說過於困難的問題，那麼接下來提出的問題將大大簡化，”Wainer (1990) 寫道。這項考試被稱為自適應測試，因為 CAT 可以根據學生的回答修改或更改測試專案的難度級別。CAT 比傳統測試更有效、更集中，並且 CAT 可以收集更多資料以獲得更可靠的結果，方法是利用技術。此外，它非常耗時且資源密集型。由於 CAT 具有很強的區分能力，因此更容易區分高績效和低績效的考生。

在 CAT 中製作測試專案需要許多學術領域的一套技能以及每個能力的多個指標。三個能力級別是 1 級、2 級和 3 級。低級別能力更容易評估，而高級別能力更難確定。此外，低級別能力包含構建式反應（開放式）專案，而高級別能力包含選擇式反應（封閉式）專案。專案克隆是一種用於提高測試專案可用性和降低專案創作成本的技術。

試題克隆是指建立測試試題以評估相同的概念，但使用替換的隨機元件（名稱、地點等）。它允許建立試題庫，從而實現經濟高效的CAT（計算機自適應測試）部署。您可能同意我們的觀點，即開發測試試題以及針對每個指標的試題都具有挑戰性。例如，某些指標無法以文字形式進行評估，而另一些指標只能使用數學題進行測試。對於有多個正確答案的測試試題，評分需要使用評分標準。

同樣重要的是要理解CAT是診斷性、形成性還是總結性。如果是診斷性目標，則需要許多具有單一操作的元素（診斷錯誤和解決要求）。但是，如果目標是總結性，則需要複雜的試題來評估熟練程度。關於CAT測試型別，選擇題需要更多試題，而簡答題則需要較少試題。

結論

研究比較了計算機輔助心理評估對被試的影響與傳統的紙筆心理測量管理程式，結果表明，不同管理方式對被試自我報告的焦慮、肌電圖測量的壓力或任務滿意度沒有顯著差異。此外，計算機輔助評估被設定為不同的速度效率，並且據推測，更有利於激發被試對測試細節的開放性。

Utkarsh Shukla

更新於：2023年2月14日

瀏覽量：1K+

開啟您的職業生涯

完成課程獲得認證

開始學習