使用 Python 和 OpenAI 生成影像
簡介
在這個生成式 AI 越來越流行的世界裡,使用 AI 生成影像也就不足為奇了。其中一種方法是使用流行的 OpenAI,也就是 ChatGPT 的建立者。開發人員、作家和設計師正在利用 ChatGPT API 來更快地完成工作。
因此,在本文中,我們將嘗試瞭解 OpenAI 的 DALL-E,它可以用於生成影像。我們將用程式碼實現 ChatGPT API Python。
如何在 Python 中使用 OpenAI 生成影像?
要使用 OpenAI 生成影像並使用 Python 編輯影像,我們將不得不使用 OpenAI 的 DALL-E API。因此,DALL-E 是 OpenAI 的一項流行服務,它根據我們提供的提示生成逼真的影像。
遵循本教程所需的先決條件:
擁有 OpenAI 帳戶,並有可用的積分來使用 API 金鑰。
瞭解 Python 程式碼編寫。
瞭解 API 的基本知識。
什麼是 OpenAI 的 DALL-E?
在進入教程之前,至少需要稍微瞭解一下我們將要使用的生成式 AI 服務。
DALL·E 是 OpenAI 用於生成影像的 AI 模型。它可以根據自然語言提示建立逼真的影像和藝術作品。它基於神經網路和潛在擴散模型 (LDM) 的研究。這使得它能夠根據人類提供的提示生成影像。
該系統使用 GPT-3 模型的修改版本。對於那些不知道的人,OpenAI GPT-3 是 OpenAI 廣為人知的語言模型。
DALL-E 可以解釋人類生成的輸入並生成所需的影像。因為它在訓練過程中經歷了海量的影像-文字對資料集。DALL·E 學會將文字描述與視覺概念聯絡起來。這使其能夠生成與給定提示匹配的影像。
設定您的環境
為了開始 Python 程式碼的實現,首先我們需要在 Python 中設定 API 金鑰和環境。之後,繼續編寫 Python 程式碼並透過我們的提示完成影像生成。
以下是使用 Python 中的 OpenAI 生成影像需要遵循的步驟。
步驟 1 - OpenAI 帳戶和 API 金鑰
如果您已經有 OpenAI 帳戶,請登入您的帳戶並點選右上角的個人資料圖示。您會找到“檢視 API 金鑰”,然後點選“建立新的金鑰”並在此處建立一個。如果您沒有帳戶,請使用您選擇的任何註冊方法建立一個帳戶,然後按照相同的步驟操作。
建立新的金鑰後,複製此金鑰並將其儲存到您選擇的位置。
步驟 2 - 安裝 OpenAI 庫。
檢查 Python 版本以確保您的 Python 版本為 3.7.1 或更高版本。
python --version
在您的系統上建立 Python 環境。
在 Windows 中 -
PS> python -m venv venv PS> .\venv\Scripts\activate
在 Linux/MacOS 中
$ python -m venv venv $ source venv/bin/activate
使用 pip 安裝 OpenAI 庫。
python -m pip install openai
步驟 3 - 使用 API 金鑰設定環境。
現在您已安裝 OpenAI Python 庫,您需要使用 API 金鑰設定您的環境。為此,您可以使用環境變數來儲存您的 API 金鑰。這將使您的 Python 指令碼能夠使用它。
在 Windows 中 -
(venv) PS> $ENV:OPENAI_API_KEY = "<your-key-value-here>"
在 Linux/MacOS 中 -
(venv) $ export OPENAI_API_KEY="<your-key-value-here>"
將“<your-key-value-here>”替換為您之前儲存的 API 金鑰。
我們的 Python 環境現已設定,我們的 API 金鑰也已準備就緒。現在是時候使用 DALL-E 在 Python 中生成影像了。
在 Python 中使用 DALL·E 進行影像生成
在深入瞭解使用 DALL-E 在 Python 中生成影像的實際程式碼之前,讓我們先了解一下 DALL-E 的影像生成定價模型。
DALL-E 每張影像的定價
OpenAI 根據生成的影像解析度對每次影像生成進行定價。下表總結了每種解析度的每影像定價。
解析度 | 每張影像的價格 |
---|---|
256×256 | $0.016 |
512×512 | $0.018 |
1024×1024 | $0.020 |
但是……不要被這些價格嚇到。為什麼?因為,如果您最近在 OpenAI 平臺上註冊,那麼它會在前 3 個月提供 18 個積分的免費試用。不過,這可能會限制生成的影像解析度。
使用 Python 中的 OpenAI 生成影像
在下面的程式碼中,我們將匯入 OpenAI 庫,並將 API 金鑰儲存在環境變數中。我們將使用 OpenAI 庫的 Image.create() 函式來儲存響應,該響應將接受使用者呼叫的使用者生成的提示。
檔名 - image-creator.py
import openai openai.api_key = "YOUR_API_KEY" PROMPT = "Clean image of Harley Quinn imagined as a duck" response = openai.Image.create( prompt=PROMPT, n=1, size="256x256", ) print(response["data"][0]["url"])
在此程式碼中,您需要將“YOUR_API_KEY”替換為您之前儲存的金鑰。您還可以更改“size”變數中的影像解析度。您可以調整“n”引數以更改要為您的提示生成的影像數量。您也可以在變數中新增您自己的提示。
要檢視輸出,請在您的終端中執行 Python 檔案:
python image-creator.py
輸出
我們對模型提供的提示的輸出:

結論
恭喜!您已成功學習瞭如何透過 Python 中的 OpenAI API 使用 OpenAI 的 DALL·E 2 生成影像。憑藉這些知識,您可以探索許多創意可能性,並在您的應用程式中使用 AI 生成的影像,以滿足各種用例。盡情體驗 DALL-E 及其驚人的影像生成功能吧!