生成對抗網路 - 架構與型別



生成對抗網路 (GAN) 通常使用卷積神經網路 (CNN) 等架構。GAN框架由兩個神經網路組成:**生成器**和**判別器**。這兩個網路扮演著重要的角色,生成器專注於建立新資料,而判別器則對其進行評估。閱讀本章,瞭解GAN的架構、元件、型別及其使其如此強大的機制。

生成器在GAN架構中的作用

GAN架構的第一個主要部分是生成器。讓我們看看它的功能和結構:

生成器:功能和結構

生成器的主要目標是生成新的資料樣本,這些樣本旨在類似於資料集中的真實資料。它從一個隨機噪聲向量開始,並透過全連線層(如Dense或卷積層)將其轉換以生成合成資料樣本。

生成器:層和元件

以下是生成器神經網路的層和元件:

  • **輸入層** - 生成器接收低維隨機噪聲向量或輸入資料作為輸入。
  • **全連線層** - FLC用於增加輸入噪聲向量的維數。
  • **轉置卷積層** - 這些層也稱為反捲積層。它用於上取樣,即生成具有比輸入特徵圖更大的空間維度的輸出特徵圖。
  • **啟用函式** - 兩個常用的啟用函式是:**Leaky ReLU**和**Tanh**。Leaky ReLU啟用函式有助於減少ReLU單元死亡問題,而Tanh啟用函式確保輸出在特定範圍內。
  • **輸出層** - 它產生最終的資料輸出,例如特定解析度的影像。

生成器:目標函式

生成器神經網路的目標是建立判別器無法區分於真實資料的資料。這是透過最小化生成器的損失函式實現的:

$$\mathrm{L_{G} \: = \: \log(1 \: - \: D(G(Z)))}$$

這裡,G(z) 是生成的資料,D(⋅) 表示判別器的輸出。

判別器在GAN架構中的作用

GAN架構的第二部分是判別器。讓我們看看它的功能和結構:

判別器:功能和結構

判別器的主要目標是將輸入資料分類為真實資料或由生成器生成的資料。它將資料樣本作為輸入,並輸出一個機率值,指示樣本是真是假。

判別器:層和元件

以下是判別器神經網路的層和元件:

  • **輸入層** - 判別器接收來自真實資料集或生成器的樣本作為輸入。
  • **卷積層** - 它用於對輸入資料進行下采樣以提取相關特徵。
  • **全連線層** - FLC用於處理提取的特徵並進行最終分類。
  • **啟用函式** - 它使用Leaky ReLU啟用函式來解決梯度消失問題。它還引入了非線性。
  • **輸出層** - 正如其名稱所示,它輸出一個介於0和1之間的單個機率值,指示樣本是真是假。

判別器:目標函式

判別器神經網路的目標是最大化其正確區分真實資料和生成資料的能力。這是透過最小化判別器的損失函式實現的:

$$\mathrm{L_{D} \: = \: -(\log D(X) \: + \: \log(1 \: - \: D(G(Z))))}$$

這裡,“x”是真實資料樣本。

生成對抗網路型別

根據生成器和判別器網路相互互動的方式,我們可以擁有不同型別的GAN模型。以下是一些值得注意的變體:

Vanilla GAN

Vanilla GAN 代表生成對抗網路 (GAN) 的最簡單形式。它提供了對 GAN 工作原理的基本理解。“Vanilla”一詞意味著這是最簡單的形式,沒有任何高階修改或增強。

深度卷積GAN (DCGAN)

DCGAN 是 GAN 最流行的實現之一。它由**卷積網路 (ConvNets)**代替**多層感知器**來穩定 GAN 訓練。這些準則顯著穩定了 GAN 的訓練,尤其是在影像生成任務中。

DCGAN的一些關鍵特性包括:

  • 帶步長的卷積
  • 批歸一化
  • 移除全連線隱藏層

條件GAN (cGAN)

條件GAN (cGAN) 將附加的條件資訊(如類別標籤、屬性甚至其他資料樣本)包含到生成器和判別器中。藉助這些條件資訊,條件GAN使我們可以控制生成輸出的特性。

CycleGAN

CycleGAN 用於非配對影像到影像的轉換任務,其中輸入和輸出影像之間沒有關係。迴圈一致性損失用於確保從一個域轉換到另一個域再轉換回來會產生一致的結果。

漸進式GAN (ProGAN)

ProGAN 透過在訓練期間逐步提高生成器和判別器的解析度來生成高解析度影像。使用這種方法,可以建立更詳細和更高質量的影像。

StyleGAN

StyleGAN是由英偉達開發的,專門用於生成逼真的高質量影像。它們引入了一些創新的影像合成技術,並對特定屬性具有更好的控制能力。

拉普拉斯金字塔GAN (LAPGAN)

拉普拉斯金字塔GAN (LAPGAN) 是一種生成對抗網路,它使用多解析度方法來生成高質量影像。它使用拉普拉斯金字塔框架,其中影像在多個尺度上生成。

與標準 GAN 相比,LAPGAN 在建立詳細和逼真的影像方面更有效。

結論

GAN使我們能夠在各個領域建立逼真的資料。在本章中,我們解釋了GAN的架構和機制。

廣告
© . All rights reserved.