穩定擴散 - 模型版本

自發布以來，穩定擴散模型經歷了重大改進，每個版本都積累了之前版本的經驗教訓。本章比較了穩定擴散各個版本的功能。

穩定擴散 1.x

第一代穩定擴散模型，稱為 1.x 系列，包括 1.1、1.2、1.3、1.4 和 1.5 版本。它們能夠生成各種風格的影像，並且所需的計算能力和資源有限。

2.x 系列包括 2.0 和 2.1。該系列旨在建立高解析度影像，並能夠理解表達性和複雜的提示。

穩定擴散 XL 1.0 是最常用的開源版本，它能夠建立具有改進的色彩分級和構圖的高解析度影像。此外，此版本可以理解複雜的提示和概念。

穩定擴散 XL Turbo (SDXL Turbo) 是 SDXL 1.0 的擴充套件，旨在一步快速生成影像。

穩定擴散 3 是 Stability AI 於 2024 年 3 月釋出的最新版本，在解釋提示、影像質量和解析度以及拼寫能力等功能方面效能有所提升。該模型仍處於預覽階段，尚未公開發布。

下表總結了穩定擴散各個版本的特性和改進 -

特性	SD 1.5	SD 2.0	SD 2.1	SD XL 1.0
釋出日期	2022 年 10 月	2022 年 11 月	2022 年 12 月	2023 年 7 月
解析度	512x512	768x768	768x768	1024x1024
提示技術	OpenAI 的 CLIP Vit-L/14	LAION 的 OpenCLIP-ViT/H	LAION 的 OpenCLIP-ViT/H	OpenCLIP-ViT/G 和 CLIP-ViT/L
優勢	初學者友好，在風景和建築主題方面表現更好	改進對複雜提示的處理和解釋，更好的影像解析度	改進的概念理解，更好的色彩分級和影像質量	更好的肖像，高解析度和影像質量，更短的提示
限制	提示解釋能力較差	生成方面更具限制性，NSFW 過濾	更“審查”，尤其是在生成名人形象和藝術風格時。	需要計算資源才能在本地執行

列印頁面