随着人工智能生成的手变得越来越逼真,人们将很难识别假手

   日期:2024-09-23     来源:本站    作者:admin    浏览:137    

  

  

  当艾丹·拉根(Aidan Ragan)创造人工生成的图像时,他希望照片中的人拥有多节的、静脉状的手,或多或少有五根手指。但本月,当他在佛罗里达大学(University of Florida)上关于人工智能在艺术中的课程时,他惊讶地看到一位受欢迎的图像制作者大量制作出逼真的手。

  “这太不可思议了,”19岁的拉根在接受《华盛顿邮报》采访时说。“这是阻碍它发展的一件事,现在它已经完善了。这有点吓人,但也令人兴奋。”

  人工智能图像生成器根据书面指令创建图片,其受欢迎程度和性能都迅速上升。人们输入各种各样的提示,从平凡的(画圣诞老人)到荒谬的(彩色玻璃风格的太空腊肠犬),软件就会吐出一幅类似专业绘画或写实照片的图像。

  然而,这项技术有一个重大缺陷:创造出栩栩如生的人手。训练人工智能的数据集通常只捕捉到手的碎片。这通常会导致照片上的手指过多或手腕伸展,这表明人工智能生成的图像是假的。

  但在3月中旬,广受欢迎的图像制作公司Midjourney发布了一个软件更新,似乎解决了这个问题,艺术家们报告说,这个工具创造的图像完美无瑕。这一改进伴随着一个大问题:本周,该公司的增强型软件被用于炮制前总统特朗普被捕的假照片,这些照片看起来很真实,并在网上疯传,显示出这项技术的颠覆性力量。

  这一看似无害的更新对依赖人工智能图像生成器制作逼真艺术的平面设计师来说是一个福音。但它引发了一场更大的争论,即生成的内容与真实图像无法分辨的危险。有人说这种超逼真的人工智能会让艺术家失业。还有人说,完美无瑕的图片会让深度造假活动更加可信,没有明显的线索表明图片是伪造的。

  加州大学伯克利分校的数字取证教授哈尼·法里德(Hany Farid)说:“在确定所有这些细节之前,一般人会这样想:‘好吧,这里有七根手指,那里有三根手指——这可能是假的。’”“但当所有这些细节都变得正确时,这些视觉线索就变得不那么可靠了。”

  过去一年,随着生成式人工智能(generative artificial intelligence)的大幅发展,文本转图像生成器出现了爆炸式增长。生成式人工智能支持基于输入数据创建文本、图像或声音的软件。

  广受欢迎的Dall-E 2由OpenAI公司开发,以画家萨尔瓦多·达利和迪士尼皮克斯动画工作室的WALL-E命名,去年7月推出时震动了互联网。今年8月,初创公司Stable Diffusion发布了自己的版本,本质上是一种反dall - e,对如何使用限制更少。Midjourney研究实验室在夏天推出了自己的版本,这幅画在8月份在科罗拉多州博览会上赢得艺术比赛时引发了争议。

  这些图像制作者的工作原理是从互联网上抓取数十亿张照片,然后识别出照片和旁边的文字之间的模式。例如,当有人输入“兔子兔”时,该软件知道它与毛茸茸的动物的图片有关,并将其吐出。

  但佛罗里达大学(University of Florida)人工智能与艺术副教授艾米莉亚·温格-熊皮(Amelia Winger-Bearskin)说,对该软件来说,重现人手仍然是一个棘手的问题。

  她说,人工智能生成的软件还不能完全理解“手”这个词的意思,这使得身体部分难以渲染。她说,手有很多种形状、大小和形式,而训练数据集中的图片往往更专注于面部。如果描绘的是双手,它们通常是交叉的或手势,提供了一个突变的身体部分。

  “如果一个人的每张照片都是这样的,”她在Zoom视频采访中完全摊开双手说,“我们可能可以很好地复制手。”

  这个月Midjourney的软件更新似乎已经解决了这个问题,Winger-Bearskin说,尽管她指出这并不完美。“我们还遇到过一些非常奇怪的情况,”她说。中程航空没有回应记者寻求进一步了解其软件更新的置评请求。

  Winger-Bearskin表示,Midjourney可能改进了它的图像数据集,将没有遮挡手的照片标记为更高优先级,以便算法学习,而将遮挡手的图像标记为较低优先级。

  31岁的德国平面设计师朱莉·维兰(Julie Wieland)说,她受益于Midjourney能够创造出更逼真的手。Wieland使用该软件为视觉营销活动创建情绪板和实物模型。她说,她工作中最耗时的部分通常是在后期制作中修复人手。

  但她说,这次更新是苦乐参半的。维兰经常喜欢修改人工智能生成的图像的手部,或者让图像符合她喜欢的创意美学,这在很大程度上受到了王家卫电影《我的蓝莓之夜》中著名的灯光、眩光和透过窗户的镜头的启发。

  “我确实怀念那些不那么完美的外表,”她说。“虽然我喜欢从《中途之旅》中直接看到美丽的画面,但我最喜欢的部分实际上是它的后期制作。”

  按Enter键跳到旋转木马的末尾

  我们如何创作艺术

  人工智能图像生成器是否接受过“理解”公司的培训

  数以亿计的图像,通常从互联网(可能包括你的),为了凭空创造新的图像。自己试试吧。

  我们如何沟通

  ChatGPT分析大量的信息,“写出”自然的文本。(例如,你可以让它做“以艾米纳姆的风格写歌词”之类的事情。)尽管存在准确性和偏见的问题,但它在很多方面都得到了应用。

  未来专家预测

  下一个人工智能的分类将包括更多面向公众的工具、为大公司、军事和医疗应用量身定制的产品,以及从事各种工作的机器人(包括类人机器人)。

  计划从事人工智能事业的拉根还表示,这些完美的图像减少了与人工智能图像制作相关的乐趣和创造力。“我真的很喜欢诠释艺术方面的东西,”他说。“现在,它感觉更僵硬了。它给人的感觉更像机器人……更像工具。”

  加州大学伯克利分校的法里德表示,Midjourney制作更好图像的能力会带来政治风险,因为它可能会生成看起来更可信的图像,并可能引发社会愤怒。他指出,上周在Midjourney拍摄的照片似乎合理地显示了特朗普被逮捕,尽管他并没有被捕。法里德指出,特朗普的领带和手的长度等小细节正在变得越来越好,使其更加可信。

  “让人们相信这些东西很容易,”他说。“当没有视觉错误时,现在就更容易了。”

  法里德说,就在几个星期前,发现制作粗糙的手是判断图像是否深度伪造的可靠方法。他说,鉴于质量的提高,这一点越来越难做到。但他说,还是有线索的,通常在照片的背景中,比如一根毁容的树枝。

  法里德说,人工智能公司应该更广泛地考虑他们通过改进技术可能造成的危害。他说,他们可以安装护栏,禁止复制某些文字(他说Dall E-2有),添加图像水印,防止匿名账户创建照片。

  但是,法里德说,人工智能公司不太可能放慢他们的形象制造商的改进。

  “生成式人工智能领域正在进行军备竞赛,”他说。“每个人都想弄清楚如何赚钱,他们行动迅速,而安全却让你慢了下来。”

 
打赏
 
更多>同类文章

推荐图文
推荐文章
点击排行