自動編碼器的應用是什麼?


資料壓縮被應用於計算機視覺、網路、架構和許多其他領域。人工智慧包含廣泛的技術和方法,使計算機系統能夠應對資料壓縮等挑戰。自動編碼器是無監督神經網路,透過機器學習壓縮資料。

什麼是自動編碼器?

自動編碼器 (AE) 是一種無監督的人工神經網路,在機器學習中提供壓縮和其他功能。自動編碼器的主要功能是使用前饋方法從輸入重建輸出。輸入在被解壓縮為輸出之前會被壓縮,輸出通常與原始輸入相同。自動編碼器就像一個衡量和比較相似輸入和輸出以執行結果的工具。

自動編碼器也稱為陀螺網路或自動關聯器。

編碼器、程式碼和解碼器是自動編碼器的三個主要組成部分。初始資料被轉換為編碼結果,然後由網路的後續層擴充套件為最終輸出。檢查“去噪”自動編碼器是瞭解自動編碼器的一種方法。去噪自動編碼器透過將噪聲輸入與輸出結合來細化輸出,從而重建表示原始輸入集的內容。自動編碼器在影像處理、分類和機器學習的其他方面都有應用。

自動編碼器架構

自動編碼器由三個部分組成:

  • **編碼器** - 編碼器是一個完全整合的、前饋神經網路,它將輸入影像壓縮到潛在空間表示中,並將其編碼為低維度的壓縮表示。壓縮後的影像是對原始影像的變形複製。

  • **程式碼** - 網路的這一部分儲存傳遞給解碼器的輸入的縮減表示。

  • **解碼器** - 解碼器與編碼器類似,也是一個前饋網路,結構與編碼器相同。該網路負責將提供的程式碼重新組裝到其原始維度。

自動編碼器的型別

卷積自動編碼器

自動編碼器在其傳統結構中忽略了訊號可以被視為其他訊號之和的思想。卷積自動編碼器利用了這一發現,它使用卷積運算子。它們學習將輸入編碼為一系列基本訊號,然後透過改變影像的幾何形狀或反射率從這些訊號重建輸入。

稀疏自動編碼器

稀疏自動編碼器提供了另一種在不減少隱藏層中節點數量的情況下引入資訊瓶頸的方法。相反,我們將設計我們的損失函式來懲罰層內的啟用。

深度自動編碼器

深度自動編碼器是普通自動編碼器的擴充套件。深度自動編碼器的第一層用於表示原始輸入中的第一階特徵。第二層表示與第一階特徵外觀模式相關的第二階特徵。深度自動編碼器的更深層更有可能學習更高階的特徵。

深度自動編碼器由兩個對稱的深度信念網路組成

  • 前四五層淺層表示網路的編碼部分,後四五層外部層表示網路的解碼部分。

  • 解碼部分包含第二組四五層。

收縮自動編碼器

收縮自動編碼器是一種深度學習方法,它透過神經網路幫助編碼未標記的訓練輸入。這是透過建立一個損失項來實現的,與輸入訓練樣本相比,該損失項會懲罰隱藏層啟用的大導數。有效地懲罰輸入的微小變化導致編碼空間發生顯著差異的情況。

自動編碼器的應用

到目前為止,我們已經看到了各種各樣的自動編碼器,每個自動編碼器都擅長不同的任務。讓我們看看它們可以做的一些事情。

資料壓縮

儘管自動編碼器旨在壓縮資料,但在實踐中很少出於此目的使用它們。原因如下:

  • **有失真壓縮** - 自動編碼器的輸出與輸入不完全相同,但它是接近但退化的表示。它們不是無失真壓縮的最佳選擇。

  • **資料特定** - 自動編碼器只能壓縮與其訓練資料相同的資料。它們不同於傳統的像 jpeg 或 gzip 這樣的資料壓縮演算法,因為它們學習與提供的訓練資料相關的特徵。因此,我們不能期望用在手寫數字上訓練的自動編碼器來壓縮風景照片。

自動編碼器很少用於壓縮,因為我們現在有更有效和簡單的演算法,如 jpeg、LZMA 和 LZSS(與霍夫曼編碼一起在 WinRAR 中使用)。近年來,自動編碼器已被用於影像去噪和降維。影像去噪用於獲取有關影像內容的準確資訊。

降維

自動編碼器將輸入縮減為儲存在稱為程式碼的中間層中的縮減表示。透過將此層與模型分離,輸入的資訊已被壓縮,現在可以將每個節點視為一個變數。因此,我們可以確定,透過刪除解碼器,輸出為編碼層的自動編碼器可用於降維。

特徵提取

自動編碼器的編碼部分有助於學習輸入資料中存在的關鍵隱藏特徵,從而減少重建誤差。在編碼過程中形成了新的獨特特徵組合。

影像生成

VAE(變分自動編碼器)是一種生成模型,用於生成模型尚未見過的影像。其理念是,系統將根據輸入影像(如人臉或風景)生成類似的影像。其目的是

  • 建立新的動畫角色

  • 建立虛構的人像

  • 影像著色

自動編碼器的目的之一是將黑白影像轉換為彩色影像。彩色影像也可以轉換為灰度影像。

更新於: 2022年3月16日

2K+ 次瀏覽

開啟你的 職業生涯

透過完成課程獲得認證

開始學習
廣告