使用 Python 和 OpenAI 生成影像


簡介

在這個生成式 AI 越來越流行的世界裡,使用 AI 生成影像也就不足為奇了。其中一種方法是使用流行的 OpenAI,也就是 ChatGPT 的建立者。開發人員、作家和設計師正在利用 ChatGPT API 來更快地完成工作。

因此,在本文中,我們將嘗試瞭解 OpenAI 的 DALL-E,它可以用於生成影像。我們將用程式碼實現 ChatGPT API Python。

如何在 Python 中使用 OpenAI 生成影像?

要使用 OpenAI 生成影像並使用 Python 編輯影像,我們將不得不使用 OpenAI 的 DALL-E API。因此,DALL-E 是 OpenAI 的一項流行服務,它根據我們提供的提示生成逼真的影像。

遵循本教程所需的先決條件:

  • 擁有 OpenAI 帳戶,並有可用的積分來使用 API 金鑰。

  • 瞭解 Python 程式碼編寫。

  • 瞭解 API 的基本知識。

什麼是 OpenAI 的 DALL-E?

在進入教程之前,至少需要稍微瞭解一下我們將要使用的生成式 AI 服務。

DALL·E 是 OpenAI 用於生成影像的 AI 模型。它可以根據自然語言提示建立逼真的影像和藝術作品。它基於神經網路和潛在擴散模型 (LDM) 的研究。這使得它能夠根據人類提供的提示生成影像。

該系統使用 GPT-3 模型的修改版本。對於那些不知道的人,OpenAI GPT-3 是 OpenAI 廣為人知的語言模型。

DALL-E 可以解釋人類生成的輸入並生成所需的影像。因為它在訓練過程中經歷了海量的影像-文字對資料集。DALL·E 學會將文字描述與視覺概念聯絡起來。這使其能夠生成與給定提示匹配的影像。

設定您的環境

為了開始 Python 程式碼的實現,首先我們需要在 Python 中設定 API 金鑰和環境。之後,繼續編寫 Python 程式碼並透過我們的提示完成影像生成。

以下是使用 Python 中的 OpenAI 生成影像需要遵循的步驟。

步驟 1 - OpenAI 帳戶和 API 金鑰

  • 如果您已經有 OpenAI 帳戶,請登入您的帳戶並點選右上角的個人資料圖示。您會找到“檢視 API 金鑰”,然後點選“建立新的金鑰”並在此處建立一個。如果您沒有帳戶,請使用您選擇的任何註冊方法建立一個帳戶,然後按照相同的步驟操作。

  • 建立新的金鑰後,複製此金鑰並將其儲存到您選擇的位置。

步驟 2 - 安裝 OpenAI 庫。

  • 檢查 Python 版本以確保您的 Python 版本為 3.7.1 或更高版本。

python --version
  • 在您的系統上建立 Python 環境。

在 Windows 中 -

PS> python -m venv venv
PS> .\venv\Scripts\activate

在 Linux/MacOS 中

$ python -m venv venv
$ source venv/bin/activate
  • 使用 pip 安裝 OpenAI 庫。

python -m pip install openai

步驟 3 - 使用 API 金鑰設定環境。

現在您已安裝 OpenAI Python 庫,您需要使用 API 金鑰設定您的環境。為此,您可以使用環境變數來儲存您的 API 金鑰。這將使您的 Python 指令碼能夠使用它。

在 Windows 中 -

(venv) PS> $ENV:OPENAI_API_KEY = "<your-key-value-here>"

在 Linux/MacOS 中 -

(venv) $ export OPENAI_API_KEY="<your-key-value-here>"

將“<your-key-value-here>”替換為您之前儲存的 API 金鑰。

我們的 Python 環境現已設定,我們的 API 金鑰也已準備就緒。現在是時候使用 DALL-E 在 Python 中生成影像了。

在 Python 中使用 DALL·E 進行影像生成

在深入瞭解使用 DALL-E 在 Python 中生成影像的實際程式碼之前,讓我們先了解一下 DALL-E 的影像生成定價模型。

DALL-E 每張影像的定價

OpenAI 根據生成的影像解析度對每次影像生成進行定價。下表總結了每種解析度的每影像定價。

解析度 每張影像的價格
256×256 $0.016
512×512 $0.018
1024×1024 $0.020

但是……不要被這些價格嚇到。為什麼?因為,如果您最近在 OpenAI 平臺上註冊,那麼它會在前 3 個月提供 18 個積分的免費試用。不過,這可能會限制生成的影像解析度。

使用 Python 中的 OpenAI 生成影像

在下面的程式碼中,我們將匯入 OpenAI 庫,並將 API 金鑰儲存在環境變數中。我們將使用 OpenAI 庫的 Image.create() 函式來儲存響應,該響應將接受使用者呼叫的使用者生成的提示。

檔名 - image-creator.py

import openai

openai.api_key = "YOUR_API_KEY"

PROMPT = "Clean image of Harley Quinn imagined as a duck"

response = openai.Image.create(
   prompt=PROMPT,
   n=1,
   size="256x256",
)

print(response["data"][0]["url"])

在此程式碼中,您需要將“YOUR_API_KEY”替換為您之前儲存的金鑰。您還可以更改“size”變數中的影像解析度。您可以調整“n”引數以更改要為您的提示生成的影像數量。您也可以在變數中新增您自己的提示。

要檢視輸出,請在您的終端中執行 Python 檔案:

python image-creator.py

輸出

我們對模型提供的提示的輸出:

結論

恭喜!您已成功學習瞭如何透過 Python 中的 OpenAI API 使用 OpenAI 的 DALL·E 2 生成影像。憑藉這些知識,您可以探索許多創意可能性,並在您的應用程式中使用 AI 生成的影像,以滿足各種用例。盡情體驗 DALL-E 及其驚人的影像生成功能吧!

更新於:2024年1月23日

138 次瀏覽

啟動您的 職業生涯

透過完成課程獲得認證

開始
廣告