Stable Diffusion 的 SDXL 模型是什么?

Stable Diffusion 的 SDXL 模型是什么?

Stable Diffusion 的 SDXL模型是v1.5模型的正式升级,该模型作为开源软件发布。

这是一个更大的模型。在人工智能世界中,我们可以期待它会变得更好。SDXL模型的参数总数为66亿,而v1.5模型的参数总数为9.8亿。

SDXL 和 v1.5 型号之间的差异

SDXL模型架构

SDXL 模型由两个模型组成 – 基础模型和精炼模型。

SDXL 模型实际上有两个模型。您运行基本模型,然后运行优化器模型。基本模型设定全局组成。细化器模型添加了更精细的细节。(您可以选择单独运行基本模型。)

语言模型(理解您的提示的模块)是最大的 OpenClip 模型 (ViT-G/14) 和 OpenAI 专有的 CLIP ViT-L 的组合。这是一个明智的选择,因为 Stable Diffusion v2 单独使用 OpenClip,并且很难提示。重新引入 OpenAI 的 CLIP 让提示变得更加容易。适用于 v1.5 的提示很有可能适用于 SDXL。

SDXL 模型具有新的图像尺寸调节,旨在使用小于 256×256 的训练图像。通过不丢弃 39% 的图像,这显着增加了训练数据。

U -Net是扩散模型最关键的部分,现在扩大了 3 倍。SDXL 模型与更大的语言模型一起生成与提示紧密匹配的高质量图像。

SDXL 的默认图像尺寸为 1024×1024。这比 v1.5 模型的 512×512 大 4 倍。

点击直达: AI 图片免费生成工具


作者: