[返回爱GPT首页]·[所有跟帖]·[ 回复本帖 ] ·[热门原创] ·[繁體閱讀]·[坛主管理]

AI为什么画不好手?其实,AI和人类都是画手困难户!

送交者: 熠熠童心[★★★★仁党文化部长★★★★] 于 2023-03-31 19:40 已读 4335 次 2赞  

熠熠童心的个人频道

+关注
如何看一张图是不是AI所画?

答案可能是——

看手。

毕竟AI在画手上犯的错误,人类一只手都数不过来。

▲网友使用 AI绘图器生成的手

AI画不好手已经成为一种共识。前段时间,Midjourney发布了V5版本,网传已经“解决了画手的问题”。

但实践证明,Midjourney的V5版本仍然无法完全拿捏“手”的难题,除了会出现不规则的手部以外,仍然不乏“六指琴魔”的存在。

▲ 网友使用MidjourneyV5版本生成的手

我们试图让ChatGPT-4的“新装备”BLIP-2——一种图生文模型,来辨认AI所“创造”的有明显错误的手。

但BLIP-2并不能意识到图片的奇怪之处。

▲ BLIP-2图生文模型对“手”的解释

这不禁让我们想到了,未来网站在进行真人验证时,或许会增加这样的选项——

毕竟,AI不仅画不好手,也辨认不出错误的手。

那么言归正传,AI在画风景和画脸方面,可谓“乱拳打死老师傅”。

但是为什么在画手上就遇到了一些困难呢?

Part.1

手真的很难画

对于这个问题,AI的“自家人”ChatGPT-4辩解道:“因为手部结构太复杂、手部姿势太多样、手和其他物品的交互实在太多了!”

▲ ChatGPT-4解释AI为什么画不好手

手难画,这是人工智能诞生前就存在的问题。古人云:画人难画手,画树难画柳,画马难画走,画兽难画狗。

创造一只令人信服的手,对于人类和AI来说,都是一件困难的事情。

早期的人类画师画手画得有多“烂”?我们从壁画中能找到不少人类画师“摆烂”的证据。

公元257年嘉峪关新城一号墓里的乐师抚琴之手只用三根线条画出,形同兽足。

▲ 公元257年嘉峪关新城一号墓里的乐师抚琴

敦煌佛爷庙湾画像砖墓里的伯牙鼓琴画像虽然已经看不真切,但是依稀可见两只手的大拇指似乎都在同一个方向,也就是说,画师画出了两只右手。

▲ 敦煌佛爷庙湾画像砖墓里的伯牙鼓琴

这并不是个例。有研究认为,直到东晋画家顾恺之说出“手挥五弦易,目送归鸿难”后,中国的画师才算是真正“征服”了手,解决了“手”的视觉再现,开始追求更高层面的“神”。

人类和AI都是画手困难户,这可能是因为:

每个手指都有很多关节,人手大概有30个几何变化点;

手指允许各种各样的抓握,使手的解剖结构变得非常复杂;

每个人的手指的大小和形状都各不相同,人类手指的形状可能是比他们的面部特征更可靠的生物特征识别。

“画不好手”是一个困扰全球画师的难题,而AI也和人类一样,在同一个难关上被卡住了。

Part.2

AI对于手真的不太熟

AI吞噬着成数千亿字节的数据,被投喂了上亿张照片或者插画。但对于手,并没有足够多的样本。

大部分的照片或者插画都没有聚焦于他们的手,手只占据了很少的画幅,并且不同角度下,手的样子也各不相同。

影视剧里,手指一弯就装作“断指”几乎已经成为了一个笑谈,但这也恰恰表达出了:空间想象力对于理解手的构造的重要性。

从静态的图像中,人类和AI都无法确定手确切的X射线结构。

而人类画师创造的各式各样的手,进一步增加了AI理解的困难度。

很多动漫人物,都只有四根手指,比如米老鼠、猫和老鼠、海绵宝宝、辛普森一家。

▲ 《辛普森一家》截图

而对于哆啦A梦这种偶尔会伸出几根手指的小圆手,BLIP-2显然也无法认同。

▲  BLIP-2将哆啦A梦的手误认为脸

此时,不得不为AI打抱不平:别说AI画的手有六根手指了,人类画的手不也千奇百怪嘛!

Part.3

AI未必理解每个部位的意义

AI可以掌握视觉模式,但无法掌握潜在的生物逻辑。

伦敦大学学院计算机科学教授彼得·本特利表示,AI工具“已经知道手有手指、指甲和手掌等元素。但他们不理解手究竟是什么。”

AI在“创造艺术”的时候并没有逻辑思维,并不理解人类每个部位的意义。

AI不知道人类有一个骨架,里面有一定数量的骨头、器官、肌肉,去控制每一个部位的运动和变化。它也并不能完全按照人类的方式“理解”这个位置或者那个位置究竟是什么。

因此,除了将手画得像外星生物以外,有时候AI也会生成与人体皮肤和其他类似物体融为一体的衣服腰带。

语言学家诺姆·乔姆斯基和他的合著者最近在《纽约时报》的一篇专栏文章中指出,机器和人类的学习方式不同,机器“使用少量信息;它不寻求推断数据点之间的强力关联,而是创造一种解释”。

为了让AI画出一只更好的手,有的网友会准确标注上手掌、拇指、食指、中指、无名指和小拇指,来帮助AI完成任务。

也就是说,当一个完全理解自己需求、完全表达自己需求的优质甲方。

而对于人工智能公司而言,为了帮助AI更好地画手,一种解决方案可能是在专门的专题数据集上训练AI程序,比如制作完全由各式各样的手组成的训练集,另一种可能是在AI数据集中添加三维效果图,以帮助图像生成器获得更多的空间意识。

人类“征服”手花费了一定的时间,AI想要完全正确地画出一只手,同样需要时间。

但就像MidjourneyV5在画手上已经取得巨大进步一样,距离AI完全学会画一只正确的手,注定不会太久。

关于“你的手画得还不如AI”的画师间的笑话,也注定很快就会过时。

参考文献:

[1]吴雪杉. 手挥五弦:中国早期人物画的再现难题[J]. 美术研究,2021,(05):27-32+41-47.

[2]高红艳. 人物绘画中的“第二张脸”[D].西安美术学院,2008.

[3]https://gagadget.com/en/how-it-works/210102-the-unattainable-pinnacle-of-art-why-does-midjourney-artificial-intelligence-draw-6-fingers-on-hands-and-how/#google_vignette
喜欢熠熠童心朋友的这个贴子的话, 请点这里投票,“赞”助支持!

内容来自网友分享,若违规或者侵犯您的权益,请联系我们

所有跟帖:   ( 主贴楼主有权删除不文明回复,拉黑不受欢迎的用户 )

谢谢童心妹🙏🙏🙏 (无内容) - guojiang (0 bytes) 04/01/23
(^-^) 熠熠童心 给 guojiang 赠送一尾锦鲤! - 熠熠童心 (89 bytes) 04/01/23
居士太客气啦,旅途鱼块🐠🌹 (无内容) - 熠熠童心 (0 bytes) 04/01/23
对呀,刚好我也有点小忙, - sc7s (23 bytes) 03/31/23
客气了👌😄 (无内容) - 熠熠童心 (0 bytes) 03/31/23
出发还早, - 熠熠童心 (118 bytes) 03/31/23
嗯,小镇太小,房间早抢光了 - 熠熠童心 (45 bytes) 03/31/23
没有AirBNB吗? (无内容) - sc7s (0 bytes) 03/31/23
没有,小镇只有几十户人家, - 熠熠童心 (41 bytes) 03/31/23
有很多的探险项目可以玩 - 熠熠童心 (35 bytes) 03/31/23
带降落伞🪂就可以啦😂😂 - 熠熠童心 (37 bytes) 03/31/23
(^-^) 熠熠童心 给 sc7s 送上一瓶哈哈可乐! - 熠熠童心 (88 bytes) 03/31/23

用户名: 密码: [--注册ID--]

标 题:

粗体 斜体 下划线 居中 插入图片插入图片 插入Flash插入Flash动画


     图片上传  Youtube代码器  预览辅助

打开微信,扫一扫[Scan QR Code]
进入内容页点击屏幕右上分享按钮

楼主前期社区热帖:

>>>>查看更多楼主社区动态...



[ 留园条例 ] [ 广告服务 ] [ 联系我们 ] [ 个人帐户 ] [ 创建您的定制新论坛频道 ] [ Contact us ]