在 5 月份,我们曾介绍过一个名为 DragGAN 的图像编辑工具,当时这个项目就曾表示将会 6 月公布源代码,如今他们兑现承诺,正式在 GitHub 上传了源代码。
先给还不知道 DragGAN 的读者简要介绍一下,DragGAN 是由 Google 的研究人员与 Max Planck 信息学研究所和麻省理工学院 CSAIL 一起开发的项目,是一个非常直观的图像编辑工具,用户只需要控制图像中的像素点和方向,就可以快速调整照片主体的位置、姿态、表情、大小和角度等。
DragGAN 的研究人员通过不依赖领域特定的建模或辅助网络,提出了一个通用框架。为了实现这一点,DragGAN 包含两个主要组成部分:基于特征的运动监督,引导手柄点向目标位置移动;以及一种新的点追踪方法,利用判别生成器特征来定位手柄点的位置。
研究人员表示,他们的方法在基于 GAN 的操作中优于 SOTA,并为图像编辑开辟了新方向。在接下来的几个月里,他们希望将基于点的编辑扩展到 3D 生成模型。
虽然公布了源代码,但源代码有严格的限制:
本作品及其任何衍生作品只能用于或打算用于非商业用途。尽管有上述规定,英伟达公司及其附属机构可以在商业上使用该作品和任何衍生作品。在此,"非商业" 是指仅用于研究或评估目的。
项目地址:https://github.com/XingangPan/DragGAN