什麼是 CAPTCHA?(用途、工作原理、reCAPTCHA、缺點)


什麼是 CAPTCHA?

CAPTCHA 是“Completely Automated Public Turing test to tell Computers and Humans Apart”(全自動區分計算機和人類的公開圖靈測試)的縮寫。它是一種由計算機使用的技術,用於識別其是否正在與人類或另一臺計算機進行通訊。隨著計算機的普及以及計算機化工作和服務的日益普遍,對改進安全性的需求促使了這種方法的發展,使計算機能夠確保在需要人工參與以確保安全的情況下,它們正在與人類打交道。

線上商務交易、網路投票、網路註冊、免費電子郵件服務註冊和其他自動化服務都容易受到模擬人類行為的軟體程式(或機器人)的攻擊,這些程式會歪曲自動化任務的結果或執行惡意活動,例如傳送垃圾郵件或訂購數百張演唱會門票。

CAPTCHA 系統向用戶呈現一個扭曲的單詞(通常放置在扭曲的背景上)以確認數字交易。要完成此過程,使用者必須將單詞輸入到一個欄位中。扭曲的單詞對於計算機來說很難解碼,而人們可以快速理解語言。

現在有些 CAPTCHA 使用圖片而不是文字,其中使用者會看到一系列圖片,並被要求找出所有圖片的共同點。使用者透過輸入該共同元素來驗證交易,而計算機則識別出它正在與人類而不是機器人打交道。“公開”是指使用的演算法是公開的,而不是保密的。其理念是,破解 CAPTCHA 的安全性需要人工智慧;僅僅找出演算法並不能消除安全措施。

CAPTCHA 如何工作?

在傳統的 CAPTCHA 中,使用者需要識別字母,這些字母至今仍在一些網站上使用。字母是扭曲的,因此機器不太可能識別它們。使用者必須破譯扭曲的文字,將正確的字元輸入表單欄位,然後提交表單才能透過測試。如果字母不匹配,則建議使用者重試。登入表單、帳戶登錄檔單、線上投票和電子商務結賬網站都使用這些測試。

理論上,計算機程式(例如機器人)將無法理解扭曲的字母。相反,習慣於在各種環境中看到和解釋字母的人(不同的字型、不同的筆跡等)將能夠識別它們。

許多機器人最多隻能輸入幾個隨機字母,因此它們透過測試的可能性在統計上很低。因此,機器人會失敗測試,並被阻止與網站或服務互動,而人們通常可以使用它。

由於高階機器人可以使用機器學習來識別這些扭曲的字元,因此簡單的 CAPTCHA 測試正在被淘汰,取而代之的是更復雜的測試。谷歌 reCAPTCHA 建立的其他測試可以區分人類使用者和機器人。

reCAPTCHA 究竟是什麼?

reCAPTCHA 是谷歌提供的一個免費工具,作為傳統 CAPTCHA 的替代品。2009 年,谷歌從卡內基梅隆大學的五位科學家手中收購了 reCAPTCHA,就在其成立幾年後。隨著時間的推移,谷歌改進了 reCAPTCHA 測試的使用者體驗,使用者不再需要依賴之前檢視模糊或損壞材料的方法。為了整合資訊,使用了各種 reCAPTCHA 測試:

  • 接受照片

  • 複選框

  • 一般評估客戶端行為(任何方式都不與客戶端關聯)

reCAPTCHA 測試是傳統 CAPTCHA 測試的更復雜變體。在某些 reCAPTCHA(例如 CAPTCHA)中,消費者必須輸入電腦難以破譯的文字影像。與傳統的 CAPTCHA 不同,reCAPTCHA 的材料來自真實的影像,例如街道地址的照片、印刷書籍中的文字和歷史報紙中的文字。

CAPTCHA、reCAPTCHA 與人工智慧專案之間的關係

隨著數百萬使用者識別難以閱讀的文字和區分模糊影像中的物件,資料會被饋送到人工智慧計算機系統中,從而提高其效能。

通常情況下,計算機演算法難以在不同的情況下識別物體和字母,因為現實世界中的環境幾乎可以無限地變化。例如,停車標誌是一個帶有白色字母“STOP”的紅色八邊形。計算機程式可能會很容易識別這樣的形狀和文字組合。但是,根據環境(相機的視角、光線、天氣等),照片中的停車標誌可能看起來與該基本描述大相徑庭。

人工智慧演算法可以透過機器學習來提高克服這些限制的能力。在停車標誌的情況下,程式設計師會向人工智慧程式提供大量關於構成停車標誌的內容和不構成停車標誌的內容的資料。為了實現這一點,他們將需要大量帶有和不帶有停車標誌的照片例項以及人類使用者來識別它們,直到軟體擁有足夠的資料才能有效工作。

reCAPTCHA 透過要求人類識別專案和句子來填補這一空白,逐漸為人工智慧程式提供足夠的資料,使其變得更強大。

CAPTCHA 的用途是什麼?

當線上應用程式需要使用者輸入時,通常會使用 CAPTCHA。假設您經營一家網際網路企業,並且需要向客戶提供在評論部分發布專案調查的選項。目前,您必須確保條目來自您的客戶或可能是人類網站訪問者。您將花費大量時間檢查經常釋出的垃圾郵件評論——最糟糕的情況是,您將與您的對手聯手。

您可以透過在網站中加入 CAPTCHA 來降低這種情況發生的風險,這需要訪問者在發表評論之前證明自己是人類。

目前,幾乎在所有需要將人類客戶與機器人區分開來的情況下,都使用人工手動測試。這加強了電子郵件關聯、警告、關聯和社交關聯的選擇系統,這與線上圖表或網路關聯(例如網路爬蟲關聯)不同。

使用 CAPTCHA 的缺點是什麼?

我們在此列出使用 CAPTCHA 可能產生的一些缺點:

  • 客戶服務糟糕。CAPTCHA 測試可能會阻礙客戶執行他們想要的操作,給他們留下對網站的不良印象,並導致他們完全放棄頁面。

  • 被阻止的個人無權使用此功能。CAPTCHA 的問題在於它們依賴於視覺感知。這使得它們對於視力確實受損的任何人來說幾乎無法理解,即使是那些外表嚴重殘疾的人。

  • 機器人可以欺騙這些測試。CAPTCHA 並非完全防機器人,不應完全依賴它們。

更新於:2022年6月2日

501 次瀏覽

開啟您的職業生涯

完成課程獲得認證

開始
廣告