AI 绘图工具 DragGAN 公布源代码


在 5 月份,我们曾介绍过一个名为 DragGAN 的图像编辑工具,当时这个项目就曾表示将会 6 月公布源代码,如今他们兑现承诺,正式在 GitHub 上传了源代码。

先给还不知道 DragGAN 的读者简要介绍一下,DragGAN 是由 Google 的研究人员与 Max Planck 信息学研究所和麻省理工学院 CSAIL 一起开发的项目,是一个非常直观的图像编辑工具,用户只需要控制图像中的像素点和方向,就可以快速调整照片主体的位置、姿态、表情、大小和角度等。

DragGAN 的研究人员通过不依赖领域特定的建模或辅助网络,提出了一个通用框架。为了实现这一点,DragGAN 包含两个主要组成部分:基于特征的运动监督,引导手柄点向目标位置移动;以及一种新的点追踪方法,利用判别生成器特征来定位手柄点的位置。

研究人员表示,他们的方法在基于 GAN 的操作中优于 SOTA,并为图像编辑开辟了新方向。在接下来的几个月里,他们希望将基于点的编辑扩展到 3D 生成模型。

虽然公布了源代码,但源代码有严格的限制:

本作品及其任何衍生作品只能用于或打算用于非商业用途。尽管有上述规定,英伟达公司及其附属机构可以在商业上使用该作品和任何衍生作品。在此,"非商业" 是指仅用于研究或评估目的。

项目地址:https://github.com/XingangPan/DragGAN


相關推薦

2023-11-08

,AIdea 类似于 POE,它是一款集成了主流大语言模型以及绘图模型的开源 APP。如果你还不知道它,那么可以简单看看这篇文章 花了小半年开发了一个 AI 套壳 APP,然而大势已过,直接开源了。 AIdea 项目前后端所有代码均采用 MIT

2023-09-27

IOS 版本恢复上架啦,看这里 喜大普奔,开源 AI 聊天、绘图软件 AIdea 终于在 Apple Store 恢复上架了。 大约在 4 周前,我发布了 花了小半年开发了一个 AI 套壳 APP,然而大势已过,直接开源了 这篇文章,将开发了近半年的 APP

2024-07-12

最后,再聊一聊压轴的高级场景以及我们的愿景。 高效绘图​ 相信每家公司的产品都有生成长图、产品海报进行分享的需求,尤其是在小程序中。 我们提供了易于上手的自动布局功能(类似 Flex 但更简洁),以及按中心点

2023-07-05

,具备瞬间创建 100 万个图形的超强能力,可结合 AI 进行绘图,生成界面。同时,LeaferJS 还为跨平台开发提供了统一而丰富的交互事件,马上会支持小程序、Node.js。 LeaferJS 提供了一项全新的服务,你可以利用它开发与绘图、UI

2024-08-09

择适合自己的 AI 生图方式,基于函数计算 FC 一键部署 AI 绘图平台,三种创作方式任选其一: 1、AIGC 新手,1分钟实现 “破次元壁合照”,可以一键部署 AI 生图平台,上传您的照片,点击“开始创作”立即与网剧《少年白马醉

2023-06-16

线。敬请关注! 相关链接 完整更新日志 GitHub 上的源代码 ONLYOFFICE 官网

2022-09-21

自于视频,也有越来越多的视频被 AI 特效和计算机视觉工具所增强。但是使用传统的计算机视觉工具进行预处理和后处理会耗费更多的时间和计算资源。 CV-CUDA 能够加速 AI 特效,例如重新打光、重新定位、模糊背景和超分辨率

2022-12-17

下载。 生产力: Tango: 本质上它是一个屏幕截图工具,但它具有自动生成操作指南的创新之处。以往当我们想要教家里的长辈或者新入职的员工如何使用一个软件时,我们可能需要按步骤截图,并在每张截图上圈出需要

2023-02-10

源项目 Stable Diffusion 的诞生,催生出了一大批文本转图像工具,预计 Open-Assistant 也同样会影响内容生成和自然语言查询的发展。 Open-Assistant 目前还处于研发的初期阶段,将会使用一个公开的语言模型和大量的数据集进行训练(

2023-07-15

率。同时,该公司也警告称,输出图像的质量取决于初始绘图的细节和提示的描述性,以及所描绘场景的复杂性。 “以草图形式绘制的想法可以立即实施到作品中,为客户创建设计、演示文稿和网站的材料,甚至创建 logo。展

2023-12-06

2.1.2的基础上: 开源之夏Mogan Draw on wasm项目: 改善绘图工具的用户体验 将绘图工具编译到了wasm可直接在浏览器中使用 开源之夏可编辑PDF项目: 新增导出PDF并将tm文档作为附件嵌入的功能 可以直接使用墨干打开

2023-07-12

微软 Semantic Kernel 团队公布了该项目的 2023 年秋季发布计划。“我们的重点是在三大支柱领域提供关键的开发和增强:开源和可信性、可靠性和性能以及最新人工智能创新的集成。” 具体内容包括: 宣布采用 OpenAI Plugin 开

2024-08-14

陆麒麟软件商店人工智能专区,涵盖了AI对话、AI写作、AI绘图、AI搜索等多个领域,为用户带来更加丰富、智能的应用体验。 阿里通义 通义是一款超大规模与训练模型,为您提供全方位协助,包括知识问答、AI创作、文档作

2023-08-01

2.0开发分支向后移植了张佳在OSPP开源之夏7月完成的三个绘图工具相关的改进 重要变更​ 修复:修复了V1.1.3引入的部分插件无法使用的问题 修复:修复了V1.1.3引入的绘图工具无法正常使用的问题 绘图:在绘图模式中,