认识 Auraflow:一款真正的开源 AI 图像生成器,旨在击败SD 3

AI绘画设计> 生成式AI 2个月前 (07-25) 浏览 132

开源 AI 图像生成器之王的头衔又有了新的竞争者:Auraflow。Auraflow由生成媒体公司 Fal AI 于上周发布,它凭借其标准 Apache 2.0 许可证获得了关注,与Stability AI 发布 Stable Diffusion 3 (SD3) 时使用的限制性许可证相比,这就像一股清新的空气。

支持者认为,开源项目可以迅速加快竞争行业的开发周期,因为它让开发人员摆脱了许可和其他法律限制。在没有许可费用的情况下,社区经常围绕优秀的开源项目形成,开发人员可以调整、修改、培训甚至从他们的工作中获利。

FAL AI 在一篇博文中表示:“我们很高兴向您展示 Auraflow 模型系列的首个版本,这是迄今为止最大的完全开源的基于流的生成模型,能够生成文本到图像。”这家总部位于旧金山的公司由 Burkay Gur 和 Gorkem Yurtseven 于 2021 年共同创立,他们分别是 Coinbase 和亚马逊的工程师。该公司警告称,开源 AI 正处于危险之中。他们说:“有些人甚至大胆地宣布开源 AI 已死。不要那么快下结论!”

在超过四周的密集计算时间内,Auraflow 经历了严格的训练,包括对不同大小、分辨率(256×256、512×512 和 1024×1024)和长宽比(方形图像、风景、肖像等)的图像进行预训练。结果如何?GenEval 得分为 0.64,使用类似于 DALL-E 3 的快速增强管道后得分提升至 0.703。

使用 Auraflow 制作的几代产品。图片由 Fal AI 分享
使用 Auraflow 制作的几代产品。图片由 Fal AI 分享

换句话说,该模型在使用综合基准测试时提供了高质量的结果。然而,尽管它很好,但 Auraflow 仍然只是一个测试版,因为 Fal 认为它是 0.1 版,而不是稳定版本。

不过,该模型非常耗 VRAM。它需要强大的 GPU 和大约 12 GB 的 VRAM 才能运行其 fp16 版本 — 仅需 6GB VRAM,Stable Diffusion 3 就能很好地运行。不过,该公司声称正在开发一种更易于管理的模型。“较小的模型或 MoE 可能对计算能力有限的消费级 GPU 卡更有效,因此请密切关注 [此] 模型的迷你版本,它仍然功能强大,但运行速度要快得多,”Fal AI 表示。

Auraflow 可在Huggingface上下载,并可在 ComfyUI 中运行,ComfyUI Manager 中还提供自定义节点。

Auraflow 是 SD3 的强大替代品,但它足以击败 SD3 吗?我们比较了这两个基础模型,并测试了它们在各种艺术风格和提示下的表现。您可以判断谁最有可能赢得世界各地 AI 艺术家的青睐,我们将分享我们的观察结果。

- 1人点赞 -

发表点评 (1条)