AI为什么画不好手?其实,AI和人类都是画手困难户!
如何看一张图是不是AI所画?答案可能是——看手。毕竟AI在画手上犯的错误,人类一只手都数不过来。▲网友使用 AI绘图器生成的手AI画不好手已经成为一种共识。前段时间,Midjourney发布了V5版本,网传已经“解决了画手的问题”。但实践证明,Midjourney的V5版本仍然无法完全拿捏“手”的难题,除了会出现不规则的手部以外,仍然不乏“六指琴魔”的存在。 ▲ 网友使用MidjourneyV5版本生成的手我们试图让ChatGPT-4的“新装备”BLIP-2——一种图生文模型,来辨认AI所“创造”的有明显错误的手。但BLIP-2并不能意识到图片的奇怪之处。 ▲ BLIP-2图生文模型对“手”的解释这不禁让我们想到了,未来网站在进行真人验证时,或许会增加这样的选项—— 毕竟,AI不仅画不好手,也辨认不出错误的手。那么言归正传,AI在画风景和画脸方面,可谓“乱拳打死老师傅”。但是为什么在画手上就遇到了一些困难呢?Part.1手真的很难画对于这个问题,AI的“自家人”ChatGPT-4辩解道:“因为手部结构太复杂、手部姿势太多样、手和其他物品的交互实在太多了!” ▲ ChatGPT-4解释AI为什么画不好手手难画,这是人工智能诞生前就存在的问题。古人云:画人难画手,画树难画柳,画马难画走,画兽难画狗。创造一只令人信服的手,对于人类和AI来说,都是一件困难的事情。早期的人类画师画手画得有多“烂”?我们从壁画中能找到不少人类画师“摆烂”的证据。公元257年嘉峪关新城一号墓里的乐师抚琴之手只用三根线条画出,形同兽足。 ▲ 公元257年嘉峪关新城一号墓里的乐师抚琴敦煌佛爷庙湾画像砖墓里的伯牙鼓琴画像虽然已经看不真切,但是依稀可见两只手的大拇指似乎都在同一个方向,也就是说,画师画出了两只右手。 ▲ 敦煌佛爷庙湾画像砖墓里的伯牙鼓琴这并不是个例。有研究认为,直到东晋画家顾恺之说出“手挥五弦易,目送归鸿难”后,中国的画师才算是真正“征服”了手,解决了“手”的视觉再现,开始追求更高层面的“神”。人类和AI都是画手困难户,这可能是因为:每个手指都有很多关节,人手大概有30个几何变化点;手指允许各种各样的抓握,使手的解剖结构变得非常复杂;每个人的手指的大小和形状都各不相同,人类手指的形状可能是比他们的面部特征更可靠的生物特征识别。“画不好手”是一个困扰全球画师的难题,而AI也和人类一样,在同一个难关上被卡住了。Part.2AI对于手真的不太熟AI吞噬着成数千亿字节的数据,被投喂了上亿张照片或者插画。但对于手,并没有足够多的样本。大部分的照片或者插画都没有聚焦于他们的手,手只占据了很少的画幅,并且不同角度下,手的样子也各不相同。影视剧里,手指一弯就装作“断指”几乎已经成为了一个笑谈,但这也恰恰表达出了:空间想象力对于理解手的构造的重要性。从静态的图像中,人类和AI都无法确定手确切的X射线结构。而人类画师创造的各式各样的手,进一步增加了AI理解的困难度。很多动漫人物,都只有四根手指,比如米老鼠、猫和老鼠、海绵宝宝、辛普森一家。 ▲ 《辛普森一家》截图而对于哆啦A梦这种偶尔会伸出几根手指的小圆手,BLIP-2显然也无法认同。 ▲ BLIP-2将哆啦A梦的手误认为脸此时,不得不为AI打抱不平:别说AI画的手有六根手指了,人类画的手不也千奇百怪嘛!Part.3AI未必理解每个部位的意义AI可以掌握视觉模式,但无法掌握潜在的生物逻辑。伦敦大学学院计算机科学教授彼得·本特利表示,AI工具“已经知道手有手指、指甲和手掌等元素。但他们不理解手究竟是什么。”AI在“创造艺术”的时候并没有逻辑思维,并不理解人类每个部位的意义。AI不知道人类有一个骨架,里面有一定数量的骨头、器官、肌肉,去控制每一个部位的运动和变化。它也并不能完全按照人类的方式“理解”这个位置或者那个位置究竟是什么。因此,除了将手画得像外星生物以外,有时候AI也会生成与人体皮肤和其他类似物体融为一体的衣服腰带。语言学家诺姆·乔姆斯基和他的合著者最近在《纽约时报》的一篇专栏文章中指出,机器和人类的学习方式不同,机器“使用少量信息;它不寻求推断数据点之间的强力关联,而是创造一种解释”。 ★为了让AI画出一只更好的手,有的网友会准确标注上手掌、拇指、食指、中指、无名指和小拇指,来帮助AI完成任务。也就是说,当一个完全理解自己需求、完全表达自己需求的优质甲方。而对于人工智能公司而言,为了帮助AI更好地画手,一种解决方案可能是在专门的专题数据集上训练AI程序,比如制作完全由各式各样的手组成的训练集,另一种可能是在AI数据集中添加三维效果图,以帮助图像生成器获得更多的空间意识。人类“征服”手花费了一定的时间,AI想要完全正确地画出一只手,同样需要时间。但就像MidjourneyV5在画手上已经取得巨大进步一样,距离AI完全学会画一只正确的手,注定不会太久。关于“你的手画得还不如AI”的画师间的笑话,也注定很快就会过时。参考文献:[1]吴雪杉. 手挥五弦:中国早期人物画的再现难题[J]. 美术研究,2021,(05):27-32+41-47.[2]高红艳. 人物绘画中的“第二张脸”[D].西安美术学院,2008.[3]https://gagadget.com/en/how-it-works/210102-the-unattainable-pinnacle-of-art-why-does-midjourney-artificial-intelligence-draw-6-fingers-on-hands-and-how/#google_vignette
内容来自网友分享,若违规或者侵犯您的权益,请联系我们
所有跟帖: ( 主贴楼主有权删除不文明回复,拉黑不受欢迎的用户 )
楼主前期社区热帖:
>>>>查看更多楼主社区动态...