【资料图】
对于仍在从Midjourney和Dall-E的AI支持图像生成中恢复的人们,有一些令人不安的消息:我们还没有达到人工智能的极限。
AI工具操纵图像的能力仍在不断增长。
最新的例子来自马克斯普朗克研究所的一篇研究论文。 目前,这仅是一篇研究论文,但是非常令人印象深刻,让用户拖动图片元素以更改它们的外观。
如果你还不明白,请看一个例子:
不仅可以通过简单的点击和拖动更改汽车的尺寸或将微笑变成皱眉,还可以像对待3D模型一样旋转图片的主题-例如更改某人面对的方向。另一个选项是通过几次点击来调整湖面上的反射或山的高度。
创建适合用户需求的视觉内容通常需要对生成对象的姿势、形状、表情和布局等属性进行精确灵活的控制。
控制生成的传统方法依赖于手动注释的数据或先前的3D模型。
然而,这些方法经常缺乏精度、灵活性和普适性。
为了解决这些缺点,马普研究所推出了DragGAN,这是一种新方法,允许用户交互式地将图像中的任何点“拖动”到目标位置。
关键词: