
- 合成媒體教程
- 合成媒體 - 首頁
- 合成媒體 - 概述
- 合成媒體 - 發展歷史
- 合成媒體 - 分支
- 合成媒體 - Deepfakes(深度偽造)
- 合成媒體 - 影像合成
- 合成媒體 - 音訊合成
- 合成媒體 - 影片合成
- 合成媒體 - 語音合成
- 合成媒體 - 互動式合成
- 合成媒體 - 機遇還是威脅
- 合成媒體資源
- 合成媒體 - 有用資源
- 合成媒體 - 討論
合成媒體 - 影像合成
影像合成是合成媒體的一個分支,其中影像完全或部分地使用計算技術生成,而不是使用相機鏡頭。這些影像不是自然的,而是使用演算法、模型或 AI 工具建立的。合成影像用於各種領域,例如娛樂、廣告,甚至科學研究。在本節中,我們將解釋合成影像、其型別、AI 生成的合成影像以及合成影像的示例。
合成影像的型別
隨著技術的進步,開發了不同的建立人工影像的工具。以下是不同年代使用的合成影像型別。
- 畫素編輯影像:在 20 世紀 80 年代,Photoshop 等影像編輯工具變得流行起來,可以用來改變自然影像的畫素。這是合成影像生成的第一個例項。
- 計算機生成影像 (CGI):到 20 世紀 90 年代,電影和影片遊戲開始使用計算機生成影像,從而提供了逼真的視覺效果。
- AI 影像生成:目前,人工智慧已經發展到可以根據人類提示生成全新的影像。
使用 AI 的合成影像
AI 演算法在大量自然影像上進行訓練,使其能夠建立看起來真實的新影像。此過程使用深度學習和神經網路等技術。使用 AI,我們可以生成現實生活中不存在但看起來非常逼真的影像,例如人物、動物和物體。
示例 1
下圖是使用 OpenAI 的 GPT 4.0 生成的影像示例。

示例 2
下圖是使用 Google 的 imaGen-3 生成的影像示例。

AI 影像生成器如何工作?
AI 影像生成器透過使用複雜的機器學習演算法和技術來執行。以下是此過程的分步概述。
- 資料集訓練:AI 影像生成器使用大型影像資料集進行訓練。AI 從這些影像中學習模式、風格和特徵,以瞭解如何建立新的影像。
- 理解文字:然後,模型使用 NLP 技術來理解使用者提供的文字提示的含義。它將句子分解成語義成分,以理解物件及其關係。
- 生成對抗網路:模型使用生成對抗網路 (GAN),它具有生成器和鑑別器層。生成器層構建影像,而鑑別器層修復生成器構建的影像中的錯誤。
- 反饋迴圈:生成的輸出將經歷多個反饋迴圈,以確保生成的影像與文字描述緊密匹配。
合成影像生成工具
有許多工具可用於建立合成影像。一些流行的工具包括
- DALL·E:OpenAI 開發的模型,用於根據書面描述生成逼真和藝術化的圖片。
- ImaGen 3:Google 開發的模型,用於根據特定風格或場景建立影像,並可以更好地控制影像的外觀。
- Midjourney:一種從文字建立藝術和創意影像的工具,通常用於獨特和富有想象力的設計。
- Stable Diffusion:與其他模型相比,該工具使用更少的計算能力生成高質量的影像。
- Deep Dream:這也是 Google 的另一個工具,它使用神經網路中的模式將普通影像變成奇怪的、夢幻般的圖片。
廣告