图像生成模型 Stable Diffusion 背后的初创公司 Stability AI 宣布推出 Stable Doodle,一项可将草图一键生成图片的新服务。主要是通过利用最新的 Stable Diffusion 模型分析草图轮廓,然后生成“视觉上令人愉悦”的艺术再现。
Stability AI 向科技媒体 TechCrunch 透露称,“Stable Doodle 既适合专业人士,也适合新手,无论他们是否熟悉 AI 工具。借助 Stable Doodle,任何具有基本绘画技能和在线访问权限的人都可以在几秒钟内生成高质量的原图。”
与其他同类型工具不同的是,Stable Doodle 的独特之处在于可以更"精确"地控制图像生成。根据介绍,Stable Doodle 基于 Stable Diffusion XL,佐以腾讯 ARC 所开发的一项“条件控制解决方案” T2I-Adapter —— 该方案既允许 Stable Diffusion XL 接受草图作为输入,又能引导模型更好地对输出作品进行微调。
Stability AI 解释称,“T2I-Adapter 使 Stable Doodle 能够理解草图的轮廓,并根据提示与模型定义的轮廓相结合生成图像。”
除了草图形式之外,Stable Doodle 还接受通过文字提示来指导图像生成,例如“一把舒适的椅子、等距风格、穿着牛仔夹克的猫、数字艺术风格”等。目前的 Stable Doodle 尚存在限制,仅支持 14 种艺术风格。
Stability AI 的设想是,Stable Doodle 可成为设计师、插画师和其他专业人士的工具,帮助他们节省时间并最大限度地提高工作效率。同时,该公司也警告称,输出图像的质量取决于初始绘图的细节和提示的描述性,以及所描绘场景的复杂性。
“以草图形式绘制的想法可以立即实施到作品中,为客户创建设计、演示文稿和网站的材料,甚至创建 logo。展望未来,Stable Doodle 将使用户能够导入草图。此外,我们将包括特定垂直领域的用例,例如房地产应用。”
感兴趣的用户目前可通过 ClipDrop 在线免费体验 Stable Doodle 服务,但存在一定的次数限制。ClipDrop 是 Stability 在 3 月份通过收购 Init ML 所获得的一个平台,Init ML 是一家由前 Google 员工创立的 AI 初创公司,