查看原文
其他

AI 黑科技|DragGAN 已开放使用,让大象转身只需拖动鼠标,附离线版!

奇迹小呆 奇迹秀 2024-04-24
静静地做自己,让世界发现你 」
奇迹秀将不定时分享优质工具,大家可以把奇迹秀公众号设为星标,第一时间获取最新推送,以防错过优质内容。
在图像生成领域,以 Stable Diffusion 为代表的扩散模型已然成为当前占据主导地位的范式,但扩散模型依赖于迭代推理,这是一把双刃剑,因为迭代方法可以实现具有简单目标的稳定训练,但推理过程需要高昂的计算成本。



DragGAN

交互式图像编辑新高度

最近,来自马克斯・普朗克计算机科学研究所、MIT CSAIL 和谷歌的研究者们研究了一种控制 GAN 的新方法 DragGAN,能够让用户以交互的方式「拖动」图像的任何点精确到达目标点。


这种全新的控制方法非常灵活、强大且简单,有手就行,只需要选定想要「修」的部分(🔴 红点),再选择移动的方向(🔵 蓝点)然后在图像上「拖动」想改变的位置点(操纵点),剩下的交给 AI 就完事了。


比如一只狗狗,你可以通过拖拽直接修改狗狗嘴的大小,是否站立还是趴着,腿的长短等等。鼠标拖一拖,轻松变换小狗的动作。


再比如,你可以通过拖动操纵点,让单手插兜的模特把手拿出来、改变站立姿势、短袖改长袖。看上去就像是同一个模特重新拍摄了新照片:


DragGAN 能够通过精确控制像素的位置对图像进行改变,可处理的图像类型包括动物、汽车、人类、风景等,涵盖大量物体姿态、形状、表情和布局,并且用户的操作方法简单通用。


频来源:哈库那玛塔塔AI

更重要的是,得益于 AI 的加持,调整后的图像依旧符合现实逻辑,几乎看不出修图的痕迹。

目前,DragGAN 终于宣布开源,所有人都下载体验,小呆还为大家搞来了离线版,无需联网就能玩,那么你会把 DragGAN 用在哪里呢?

在公众号回复【 DragGAN 】获取下载。

免责声明:以上资源皆来源于互联网公开分享的内容,仅用于个人学习使用,请禁止用于商业用途和倒卖,如真正需要,请支持版权方。

END

  往期精选



「关注这个号的你可以说是很优秀了 」


给小呆一个「 分享 · 收藏 ·  · 在看 」四连击
继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存