Stable Diffusion 2.0 发布，加强成人内容过滤

2022-11-26 發表於开源资讯

由 CompVis 领导的 Stable Diffusion V1 改变了开源人工智能模型的性质，并在全球范围内催生了数百个其他模型和创新。Stable Diffusion 如今也是所有软件中最快攀升至 Github 10K Stars 的软件之一，在不到两个月的时间里，它的 Stars 飙升至 33K。

Stable Diffusion 2.0 与最初的 V1 版本相比，提供了许多重大的改进和功能。

新的 Text-to-Image（文本转图像）的 Diffusion 模型

Stable Diffusion 2.0 版本包括使用全新的文本编码器（OpenCLIP）训练的文本转图像模型，该模型由 LAION 在 Stability AI 的支持下开发，与早期的 V1 版本相比，大大改善了生成图像的质量。该版本中的文本转图像模型可以生成默认分辨率为 512x512 像素和 768x768 像素的图像。

这些模型是在 Stability AI 的 DeepFloyd 团队创建的 LAION-5B 数据集的子集上训练的，然后使用 LAION 的 NSFW 过滤器进一步过滤以去除成人内容。

超分辨率 Upscaler Diffusion 模型

Stable Diffusion 2.0 还包括一个 Upscaler Diffusion 模型，可以将图像的分辨率提高 4 倍。下面是该模型将一个低分辨率的图像（128x128）提升为高分辨率的图像（512x512）的例子。结合文本转图像模型，Stable Diffusion 2.0 现在可以生成分辨率为 2048x2048 甚至更高分辨率的图像。

Depth-to-Image（深度到图像）Diffusion 模型

新的深度引导的 stable diffusion 模型，称为 depth2img，它扩展了之前 V1 的图像转图像功能，为创造性的应用提供了全新的可能性。depth2img 推断输入图像的深度（使用现有模型），然后使用文本和深度信息生成新的图像。

深度转图像可以提供各种新的创造性的应用，提供与原始图像完全不同的变换，但仍然保留该图像的一致性和深度信息。

更新的 Inpainting Diffusion 模型

新版本还包括一个新的文本指导的绘画模型，在新的 Stable Diffusion 2.0 基础文本转图像上进行了微调，这使得智能地、快速地切换出图像的一部分变得更加容易。

Stability AI 将在未来几天把这些模型发布到 API 平台（platform.stability.ai）和 DreamStudio 上。

更多详情可查看：https://stability.ai/blog/stable-diffusion-v2-release

Stable Diffusion 2.0 发布，加强成人内容过滤

新的 Text-to-Image（文本转图像）的 Diffusion 模型

超分辨率 Upscaler Diffusion 模型

Depth-to-Image（深度到图像）Diffusion 模型

更新的 Inpainting Diffusion 模型

相關推薦

Stable Diffusion 数据集提供商开源类 ChatGPT 项目

Stable Diffusion 背后的创业公司融资 1 亿美元，估值已达 10 亿美元

Stability AI 开源视频生成模型 Stable Video Diffusion

Stable Diffusion XL 0.9 发布

Stable Diffusion 因版权问题被起诉

Stable Diffusion 允许艺术家从数据集中删除自己的作品

开源文生图模型 Stable Diffusion 开发商欠账 1 亿美元

Stability AI 推出新服务，几笔涂鸦就可精确生成图片

AI 绘画公司 StockAI 倒闭

开源 AI 聊天、绘图软件 AIdea 最新版本 1.0.5 发布啦

GeekAI v4.0.7 发布， AI 助手全套开源解决方案

更新指南：Xinference v0.15.2 详细指引，轻松升级！📝

Stability AI 再融资 5000 万美元，英特尔领投

DALL·E 3 绘图来啦，开源 AI 聊天、绘图软件 AIdea 现已支持 DALL·E 3