穩定擴散 - 模型版本
自發布以來,穩定擴散模型經歷了重大改進,每個版本都積累了之前版本的經驗教訓。本章比較了穩定擴散各個版本的功能。
穩定擴散 1.x
第一代穩定擴散模型,稱為 1.x 系列,包括 1.1、1.2、1.3、1.4 和 1.5 版本。它們能夠生成各種風格的影像,並且所需的計算能力和資源有限。
穩定擴散 2.x
2.x 系列包括 2.0 和 2.1。該系列旨在建立高解析度影像,並能夠理解表達性和複雜的提示。
穩定擴散 XL 1.0
穩定擴散 XL 1.0 是最常用的開源版本,它能夠建立具有改進的色彩分級和構圖的高解析度影像。此外,此版本可以理解複雜的提示和概念。
穩定擴散 XL Turbo (SDXL Turbo) 是 SDXL 1.0 的擴充套件,旨在一步快速生成影像。
穩定擴散 3
穩定擴散 3 是 Stability AI 於 2024 年 3 月釋出的最新版本,在解釋提示、影像質量和解析度以及拼寫能力等功能方面效能有所提升。該模型仍處於預覽階段,尚未公開發布。
比較穩定擴散模型
下表總結了穩定擴散各個版本的特性和改進 -
| 特性 | SD 1.5 | SD 2.0 | SD 2.1 | SD XL 1.0 |
|---|---|---|---|---|
| 釋出日期 | 2022 年 10 月 | 2022 年 11 月 | 2022 年 12 月 | 2023 年 7 月 |
| 解析度 | 512x512 | 768x768 | 768x768 | 1024x1024 |
| 提示技術 | OpenAI 的 CLIP Vit-L/14 | LAION 的 OpenCLIP-ViT/H | LAION 的 OpenCLIP-ViT/H | OpenCLIP-ViT/G 和 CLIP-ViT/L |
| 優勢 | 初學者友好,在風景和建築主題方面表現更好 | 改進對複雜提示的處理和解釋,更好的影像解析度 | 改進的概念理解,更好的色彩分級和影像質量 | 更好的肖像,高解析度和影像質量,更短的提示 |
| 限制 | 提示解釋能力較差 | 生成方面更具限制性,NSFW 過濾 | 更“審查”,尤其是在生成名人形象和藝術風格時。 | 需要計算資源才能在本地執行 |
廣告