Stable Diffusion 2.0 发布,加强成人内容过滤


由 CompVis 领导的 Stable Diffusion V1 改变了开源人工智能模型的性质,并在全球范围内催生了数百个其他模型和创新。Stable Diffusion 如今也是所有软件中最快攀升至 Github 10K Stars 的软件之一,在不到两个月的时间里,它的 Stars 飙升至 33K。

Stable Diffusion 2.0 与最初的 V1 版本相比,提供了许多重大的改进和功能。

新的 Text-to-Image(文本转图像)的 Diffusion 模型

Stable Diffusion 2.0 版本包括使用全新的文本编码器(OpenCLIP)训练的文本转图像模型,该模型由 LAION 在 Stability AI 的支持下开发,与早期的 V1 版本相比,大大改善了生成图像的质量。该版本中的文本转图像模型可以生成默认分辨率为 512x512 像素和 768x768 像素的图像。

这些模型是在 Stability AI 的 DeepFloyd 团队创建的 LAION-5B 数据集的子集上训练的,然后使用 LAION 的 NSFW 过滤器进一步过滤以去除成人内容。

超分辨率 Upscaler Diffusion 模型

Stable Diffusion 2.0 还包括一个 Upscaler Diffusion 模型,可以将图像的分辨率提高 4 倍。下面是该模型将一个低分辨率的图像(128x128)提升为高分辨率的图像(512x512)的例子。结合文本转图像模型,Stable Diffusion 2.0 现在可以生成分辨率为 2048x2048 甚至更高分辨率的图像。

Depth-to-Image(深度到图像)Diffusion 模型

新的深度引导的 stable diffusion 模型,称为 depth2img,它扩展了之前 V1 的图像转图像功能,为创造性的应用提供了全新的可能性。depth2img 推断输入图像的深度(使用现有模型),然后使用文本和深度信息生成新的图像。

深度转图像可以提供各种新的创造性的应用,提供与原始图像完全不同的变换,但仍然保留该图像的一致性和深度信息。

更新的 Inpainting Diffusion 模型

新版本还包括一个新的文本指导的绘画模型,在新的 Stable Diffusion 2.0 基础文本转图像上进行了微调,这使得智能地、快速地切换出图像的一部分变得更加容易。

Stability AI 将在未来几天把这些模型发布到 API 平台(platform.stability.ai)和 DreamStudio 上。

更多详情可查看:https://stability.ai/blog/stable-diffusion-v2-release


相關推薦

2023-02-10

个德国非营利组织,这个名字你可能不太熟悉,但 Stable Diffusion 和 Imagen 这两个知名的「文本转图像」模型所使用的训练数据集就来自于 LAION,而该组织的目标就是「向公众提供大规模机器学习模型、数据集和相关代码」。 LAI

2022-10-19

要说近期最火的 AI 项目是什么,那毫无疑问要属 Stable Diffusion,它是由初创公司 StabilityAI 于今年发布的深度学习文字转图像模型,它主要用于根据文字的描述产生详细图像。Stable Diffusion 的诞生除了让 AI 绘画这个领域突然火爆

2023-11-23

Stability AI 发布了开源视频生成模型 Stable Video Diffusion,该模型基于该公司现有的 Stable Diffusion 文本转图像模型,能够通过对现有图像进行动画化生成视频。 主要特性 文本到视频 图像到视频 14 或 25 帧,576 x 1024分辨率 多

2023-06-25

Stability AI 近日发布了 Stable Diffusion XL 0.9,这是 Stable Diffusion 文本-图像模型套件中最先进的开发成果。继 4 月发布 Stable Diffusion XL Beta 之后,Stable Diffusion XL 0.9 在图像和构图细节方面比前者有了巨大的改进。 示例 在 SDXL Beta 版

2023-01-18

日前,三位艺术家对 Stability AI(Stable Diffusion 背后的开发商)提起了诉讼,指控 Stability AI 直接、间接侵犯版权、违反 DMCA 和不正当竞争等。 这三位艺术家(Sarah Andersen、Kelly McKernan、Karla Ortiz)认为 Stability AI 在「未经原艺术

2022-12-22

今年 8 月,Stability AI 开源了一个叫 Stable Diffusion 的 AI 模型,它可以根据用户给定的文本生成对应的图像。Stable Diffusion 的原理是通过 “学习”从互联网上抓取的大量图像数据集,以获得生成图像的能力。 这个 AI 在艺术圈引

2024-05-18

位研究主管和两位大型语言模型负责人。曾开发出 Stable Diffusion 的 AI 研究团队的几位主要成员也早已从 Stability AI 公司离职。 延伸阅读 Stability AI 开源 Stable Diffusion,基于文本生成图像的 AI 模型 Stability AI 开源大型语言模

2023-07-15

图像生成模型 Stable Diffusion 背后的初创公司 Stability AI 宣布推出 Stable Doodle,一项可将草图一键生成图片的新服务。主要是通过利用最新的 Stable Diffusion 模型分析草图轮廓,然后生成“视觉上令人愉悦”的艺术再现。 Stability

2023-01-03

止用户将平台生成的图片用于二次销售。 今年,Stable Diffusion 带火了 AI 绘画/图片生成这个领域,Stable Diffusion 背后的创业公司 StabilityAI 在今年 10 月就借着这股风潮获得了 1 亿美元的融资,估值甚至达到了 10 亿美元。而且随

2023-09-27

、图生图、超分辨率、黑白图片上色等功能,集成 Stable Diffusion 模型,支持 SDXL 1.0 今天最新版本的 1.0.5 发布啦,大家快来体验体验! Github 地址: 客户端( Flutter ): https://github.com/mylxsw/aidea 服务端( Golang ): https://g

2024-07-05

一言等多个平台的大语言模型。集成了 MidJourney 和 Stable Diffusion AI绘画功能。 主要特性: 完整的开源系统,前端应用和后台管理系统皆可开箱即用。 基于 Websocket 实现,完美的打字机体验。 内置了各种预训练好的角

2024-09-25

系列 🚀 BUG修复 🛠️  修复 Dify 中使用 stable diffusion 在 Xinference 上生图的问题,现在可以使用 dify 的 stable diffusion tool 调用 Xinference 上的文生图模型,如 FLUX.1-dev 🖼️ 修复 CosyVoice 输出可能被截断的问题 🎤 修复

2023-11-11

近 5000 万美元,交易于 10 月份完成。 Stability AI 是 Stable Diffusion 背后的公司,Stable Diffusion 是一个文本转图像模型,是除 OpenAI 之外其他较为流行的生成式 AI 工具之一。 彭博社指出,此次现金注入正值 Stability AI 的关键时刻,

2023-11-08

、图生图、超分辨率、黑白图片上色等功能,集成 Stable Diffusion 模型,支持 SDXL 1.0 Github 地址: 客户端( Flutter ): https://github.com/mylxsw/aidea 服务端( Golang ): https://github.com/mylxsw/aidea-server