穩定擴散 - 模型版本



自發布以來,穩定擴散模型經歷了重大改進,每個版本都積累了之前版本的經驗教訓。本章比較了穩定擴散各個版本的功能。

穩定擴散 1.x

第一代穩定擴散模型,稱為 1.x 系列,包括 1.1、1.2、1.3、1.4 和 1.5 版本。它們能夠生成各種風格的影像,並且所需的計算能力和資源有限。

穩定擴散 2.x

2.x 系列包括 2.0 和 2.1。該系列旨在建立高解析度影像,並能夠理解表達性和複雜的提示。

穩定擴散 XL 1.0

穩定擴散 XL 1.0 是最常用的開源版本,它能夠建立具有改進的色彩分級和構圖的高解析度影像。此外,此版本可以理解複雜的提示和概念。

穩定擴散 XL Turbo (SDXL Turbo) 是 SDXL 1.0 的擴充套件,旨在一步快速生成影像。

穩定擴散 3

穩定擴散 3 是 Stability AI 於 2024 年 3 月釋出的最新版本,在解釋提示、影像質量和解析度以及拼寫能力等功能方面效能有所提升。該模型仍處於預覽階段,尚未公開發布。

比較穩定擴散模型

下表總結了穩定擴散各個版本的特性和改進 -

特性 SD 1.5 SD 2.0 SD 2.1 SD XL 1.0
釋出日期 2022 年 10 月 2022 年 11 月 2022 年 12 月 2023 年 7 月
解析度 512x512 768x768 768x768 1024x1024
提示技術 OpenAI 的 CLIP Vit-L/14 LAION 的 OpenCLIP-ViT/H LAION 的 OpenCLIP-ViT/H OpenCLIP-ViT/G 和 CLIP-ViT/L
優勢 初學者友好,在風景和建築主題方面表現更好 改進對複雜提示的處理和解釋,更好的影像解析度 改進的概念理解,更好的色彩分級和影像質量 更好的肖像,高解析度和影像質量,更短的提示
限制 提示解釋能力較差 生成方面更具限制性,NSFW 過濾 更“審查”,尤其是在生成名人形象和藝術風格時。 需要計算資源才能在本地執行
廣告

© . All rights reserved.