Deepfake技術:它是什麼,如何識別以及如何保護自己


許多人工智慧技術正被用於建設性和破壞性目的。像ChatGPT、Claude AI等技術幫助使用者根據他們的查詢生成內容。這是一個建設性的目的。Deepfake技術可以用於破壞性目的,因為使用者可以建立虛假的影像、影片和文字內容,這些內容似乎來自可信的來源。

什麼是Deepfake技術?

Deepfake技術用於製作虛假的影像、影片和錄音。這項技術用於將一個人的影像或資料與另一個人的影像或資料進行交換。這項技術也可以用來建立原創內容,但實際上是假的。這項技術提供的資訊是虛假的,但它似乎來自可信的來源。

Deepfake Technology: What It Is, How to Spot, and Safeguard

Deepfake技術的歷史

世界上每項技術都有其歷史,Deepfake也不例外。Deepfake技術始於20世紀90年代,由於研究人員使用CGI。使用CGI的目的是建立真實的人類影像。2010年,機器學習中開發了大型資料集。這導致了Deepfake技術的進步。Ian Goodfellow和他的團隊引入了一種名為生成對抗網路(GAN)的機器學習概念,它能夠生成影片、影像和音訊Deepfake。

Deepfake技術的持續發展

許多開源工具可供普通網際網路使用者用於娛樂。這些工具可以用來製作表情包,交換演員、運動員或任何其他名人的臉。這項技術在2017年變得更加先進,因此有必要採取一些措施來控制其發展,因為這可能導致這項技術被用於犯罪和惡意目的。

2018年的Deepfake技術

2018年,由於Deepfake技術快速發展,其使用成為主要關注點。許多科技平臺為其組織制定了政策,以便適度使用Deepfake技術。這導致了Reality Defender的開發,這是一個非營利組織,後來轉變為Deepfake檢測公司。

2019年的Deepfake技術

2019年,許多國家開始採取立法措施,以便控制Deepfake技術,並規範透過這項技術開發的產品。許多公司正在整合可用於檢測Deepfake的軟體應用程式。

什麼是影片Deepfake?

Deepfake影片是被使用Deepfake軟體應用程式(其中可以使用人工智慧)操縱過的媒體。Deepfake技術可以用來用另一個人的影像或聲音替換一個人的影像或聲音。這可能導致傳播某人從未說過過的虛假資訊。

如何製作Deepfake影片?

編碼器和解碼器網路用於開發Deepfake影片。編碼器和解碼器在GAN內工作,GAN的全稱是生成對抗網路。編碼器負責分析源內容。此內容包括對面部和其他特徵的分析,這些特徵將被傳輸到解碼器網路。

解碼器負責生成新內容,其中面部將被操縱,其他特徵也會發生變化。此過程將持續到任務完美完成為止。

什麼是語音克隆?

語音克隆是一個使用人工智慧軟體克隆人聲的過程。在這個過程中,會分析人類的聲音模式。分析後的聲音以與原始聲音相同的方式產生。

機器學習和人工智慧演算法用於克隆人聲。在語音克隆過程中,使用包含大量目標語音資料的音訊。這些資料的處理是基於音高、節奏、音調和語調進行的。使用人工智慧生成新的聲音。

語音克隆是如何工作的?

語音克隆的過程很複雜,需要遵循不同的步驟才能完成任務。這些步驟如下所述:

  • **語音取樣** - 這是語音克隆的第一步。在此步驟中,使用音訊來收集要克隆其聲音的人的資料。對該人的語音進行數小時的錄音,以便可以捕獲與聲音相關的不同方面。這些方面包括節奏、語調等。
  • **音訊分析** - 這是一個對收集到的語音進行分析的過程。在分析中,語音被分解成不同的部分,這些部分被稱為音素,它們是語言中使用的最小單位。還進行分析以瞭解語音的不同特徵,包括速度、音調和音高。
  • **特徵提取** - 這是第三步,從中提取語音的所需特徵。這些特徵包括口音、節奏和語調。
  • **AI模型訓練** - AI模型根據從語音中提取的特徵進行訓練。這個AI模型實際上是一個神經網路。訓練過程包括複製語音的不同特徵。
  • **微調** - 在AI模型訓練完成後,會生成克隆的聲音,然後對其進行微調,以便可以匹配克隆的聲音和原始聲音之間的所有內容。
  • **輸出生成** - 這是最後一步,其中生成克隆語音的輸出。克隆的聲音聽起來與原始聲音相似。

如何選擇語音克隆工具?

有很多工具可以用於語音克隆。在選擇工具之前,您必須考慮不同的方面。這些方面如下所述。

  • **語音輸出質量** - 克隆的聲音必須與原始聲音相似。市場上有很多工具能夠產生與原始聲音相似的克隆聲音,很難區分它們。您應該尋找能夠產生這種質量聲音的工具。
  • **使用便捷性** - 該工具應該易於使用,所有步驟都應該易於遵循,以便克隆的聲音與原始聲音無法區分。
  • **不同語言的支援** - 有些情況下需要克隆多種語言的聲音。使用者應該尋找支援不同語言的克隆工具。
  • **快速的結果** - 您必須考慮的另一個方面是輸出的速度。
  • **隱私和安全** - 您必須確保您在應用程式中使用的資料是安全的。如果您正在克隆您自己的聲音,則尤其應採取此步驟。
  • **工具的成本** - 您必須檢查您使用的工具是否滿足您的所有需求。您還必須根據克隆聲音所需的功能來檢查工具的成本。

語音克隆如何使用?

語音克隆可以用於好的目的,也可以用於壞的目的。以下是語音克隆的使用方法。

  • **語音生物特徵欺騙** - 語音被認為是生物特徵的絕佳選擇之一。壞人可以使用錄製的語音進行表示攻擊。壞人可以使用其他方法,例如計算機修改後的語音和合成語音。這些步驟用於欺騙生物特徵識別系統,並使罪犯能夠訪問敏感資訊。
  • 網路釣魚詐騙 − 語音克隆可用於實施網路釣魚詐騙。這是一種詐騙型別,騙子利用克隆的語音讓受害者誤以為正在與可信賴的人交談。此類詐騙也可能透過電子郵件進行,收件人會收到要求提供銀行賬戶詳細資訊或信用卡資訊的電子郵件。詐騙者也使用語音郵件和電話進行詐騙。
  • 虛假資訊傳播 − 語音克隆可用於傳播錯誤資訊。經過操縱的影片和音訊可能導致暴力或其他型別的傷害。
  • 偽造證據 − 可以藉助克隆語音建立偽造證據。這可能對刑事案件造成重大打擊,因為作為證據提供的音訊可能包含克隆語音。
  • 敲詐勒索 − 可以使用克隆語音進行線上敲詐勒索。這種型別的語音可能會騷擾受害者,並強迫他們支付某些費用。
  • 教育 − 語音克隆可用於教育人們。可以克隆歷史人物的語音,用於講故事和提供互動式教學。
  • 有聲讀物 − 語音克隆可用於克隆名人的聲音並將其用於有聲讀物。這些聲音可能包括自傳和其他與名人相關的內容。

什麼是淺層偽造(Shallowfakes)?

淺層偽造可以用來製作影像、影片或音訊的克隆。之所以被稱為淺層偽造,是因為其質量遠低於深度偽造。可以使用基本的編輯軟體應用程式建立淺層偽造。與深度偽造相比,淺層偽造更容易建立,因此對社會的危害更大。可以輕鬆建立虛假的身份證明。此外,罪犯還可以建立虛假的支援性證據。

建立深度偽造(Deepfakes)使用哪些技術?

許多技術有助於輕鬆製作深度偽造。這裡將討論這些技術。

生成對抗網路(GAN)

GAN是一種神經網路技術,由生成器和鑑別器演算法組成。這兩種演算法都用於建立深度偽造內容。

卷積神經網路(CNN)

CNN(卷積神經網路)負責分析視覺資料中存在的模式。CNN也用於人臉識別,並跟蹤影片中人物的運動。

自動編碼器

另一種用於建立深度偽造的神經網路技術是自動編碼器。這些自動編碼器的任務是查詢目標的屬性,其中可能包括身體動作、面部表情等等。自動編碼器將這些屬性應用於源資料。

自然語言處理

自然語言處理演算法用於建立深度偽造音訊。這些演算法負責分析目標的屬性,然後使用這些屬性生成與原始音訊相似的內容。

高效能計算

這是一種計算型別,可以幫助深度偽造獲得高效能和必要的計算能力。

影片編輯軟體

有很多影片編輯軟體應用程式,但並非所有應用程式都支援人工智慧。人工智慧技術用於改進影片的輸出。

為什麼使用深度偽造?

深度偽造有許多積極和消極的用途,我們將在此處詳細討論。

藝術

深度偽造技術正在藝術領域中使用,用於藉助藝術家作品創作新的音樂。

敲詐勒索和損害聲譽

許多例子表明,深度偽造已被用於敲詐勒索或損害個人的聲譽。製作影片和影像是為了從受害者那裡獲取錢財。色情製品和復仇色情是深度偽造的幾種形式,被用於勒索錢財。

呼叫者響應服務

深度偽造用於響應呼叫者的請求,以便提供個性化的響應。深度偽造還用於提供來電轉接和接待服務。

客戶電話支援

深度偽造用於客戶電話支援,以便可以使用虛假語音為客戶提供簡單的服務,例如告知銀行賬戶餘額或註冊投訴。

娛樂

深度偽造正在娛樂行業中使用。操縱演員的語音被用於影片遊戲和好萊塢電影中拍攝某些場景。在拍攝場景非常困難的情況下,電影中會使用深度偽造。惡搞內容也藉助深度偽造製作。

虛假證據

這是深度偽造技術的負面用途。可以偽造虛假的影像或音訊,用作證據。此證據可用於證明某人無罪或有罪。

低成本影片宣傳活動

營銷人員可以使用深度偽造來降低影片宣傳活動的成本。這可以透過使用現有的數字錄音來實現,並可以使用指令碼對話製作新的內容。

欺詐

這是另一個負面方面,深度偽造可用於冒充個人,以便獲取敏感資料,這些資料可用於實施網路犯罪。可以冒充公司高管,並訪問銀行賬戶或信用卡的憑據。

深度偽造在政治中的用途

深度偽造也可以在政治中使用,方法是操縱政治家的影片。使用可信賴的來源從人們那裡獲取資料,這些資料可能支援或反對某位政治家。

股市操縱

可以透過製作公司高管的深度偽造影片來操縱公司股價,這些影片可用於誹謗公司高管。有時,可以透過製作推出產品的深度偽造影片或高管做出的承諾來提高公司股價。

簡訊

可以複製使用者的簡訊風格並將其用於實施欺詐。美國國土安全部發布的報告稱,深度偽造技術未來可用於複製簡訊風格。

教育

深度偽造也正在教育行業中使用。正在開發人工智慧導師,以幫助為學生提供個性化服務。

如何識別深度偽造?

深度偽造技術正用於積極和消極的目的。有很多方法可以檢測深度偽造,我們將在此處詳細討論。

檢查閃爍次數

影片中的影像會閃爍,您必須檢測影像閃爍的次數。對於深度偽造,與原始影片相比,閃爍次數較少。深度偽造中也可能以不自然的方式進行閃爍。

面部和身體

通常,使用人的臉來建立深度偽造。可以透過檢查面部表情或檢測身體的動作和姿勢來檢測深度偽造。

影片長度

為了建立高質量的深度偽造,演算法需要嚴格和規律的訓練。與深度偽造影片相比,原始影片的長度通常更長。

影片中的聲音

原始影片可能包含在深度偽造影片中找不到的聲音。檢查音訊是否與影像匹配,這將有助於檢測深度偽造影片。在深度偽造影片中很難再現舌頭、口腔和牙齒。如果嘴巴內部模糊,則可能是偽造的圖片或影片。

面部融合

面部交換是一種用於建立深度偽造影像的方法。在這種情況下,存在原始影像和偽造影像融合的點。這可能導致面部顏色或紋理的差異。

結論

深度偽造是一種技術,可以使用不同的軟體應用程式和人工智慧來製作虛假的影片、音訊和影像。深度偽造可以用於積極和消極的方面。如果談論積極方面,深度偽造可用於教育、拍攝電影中的困難場景等。如果談論消極方面,深度偽造可用於敲詐勒索、傳送虛假資訊、網路犯罪等。可以透過仔細研究面部、檢查影像中的融合、檢查聲音等等來檢測深度偽造。

更新於:2024年9月9日

66 次瀏覽

啟動您的職業生涯

透過完成課程獲得認證

開始
廣告