据悉,Stable Diffusion XL Turbo 模型的最大特点,就是上述“一次迭代生成图像”,号称可以进行“即时文字转图像输出”,并能够保证图片的质量。



而其中的“对抗性扩散蒸馏技术”是以现有的大型图像扩散模型,作为“教师网络”来指导模型的生成过程,结合了“蒸馏技术”和“对抗训练”,其中“蒸馏技术”即“蒸馏模型知识,精炼模型输出”,将大型模型的知识浓缩到更小的模型中,而对抗性训练则可以改进模型,以更好地模仿教师模型输出。
此前的模型蒸馏技术难以兼顾效率和品质,这是因为快速采样通常会削弱输出品质,因此本次 Stable Diffusion XL Turbo 模型在通过“对抗性扩散蒸馏技术”在高效生成高品质图像方面,是一个重要的进步。
官方将 Stable Diffusion XL Turbo 与多个不同的模型变体进行比较,包括 StyleGAN-T++、OpenMUSE、IF-XL、SDXL 和 LCM-XL,并进行了两项实验,第一个实验要求模型评估人员随机查看两项模型的输出,并选择出其中最符合提示词的输出图像,第二项实验则与第一项实验执行大致相同,模型评估要求选择模型中输出者图像品质最佳的一方。

实验结果显示,Stable Diffusion XL Turbo 在大幅降低运算需求的同时,仍可以保持良好的图像生成品质,该模型单词迭代,即胜过 4 次迭代的 LCM-XL,而 4 次迭代的 Stable Diffusion XL Turbo 就可击败此前经过 50 步迭代配置的 Stable Diffusion XL;在 A100 GPU 上,计算 512×512 分辨率的图像,只需 207 毫秒。
IT之家注意到,目前 Stability AI 已经将相关代码公布在 Hugging Face,供个人和非商业用途使用,感兴趣的小伙伴们可以点此访问。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
未经允许不得转载:新聚网 » Stability AI 推出 Stable Diffusion XL Turbo 模型,仅需一次迭代即可生成高品质图像

新聚网
哈佛大学开源 AI 训练数据集“Institutional Books 1.0”,涵盖馆藏 98.3 万本图书
Android XR 智能眼镜 XREAL Project Aura 重要参数公布:双芯驱动,70+° FoV
全球首个儿科大模型在北京荣华医院落地,诊断准确率优于主治医师平均水平
小米米家前开盖旅行箱 18 英寸开启众筹,369 元
共建韩国最大 AI 数据中心、容纳 6 万个 GPU,亚马逊 AWS 与 SK 集团合作
OpenAI Codex 人工智能编程工具推出新功能:可一次生成多个方案
性能提升 90%,Anthropic 首次公开多智能体系统构建全流程





