中美AI大模型的差距 -6park.com

[返回八闽大地首页]·[所有跟帖]·[ 回复本帖 ] ·[热门原创] ·[繁體閱讀]·[坛主管理]

中美AI大模型的差距

送交者: 鹿特丹丹[★★为正义呐喊★★] 于 2024-02-25 10:11 已读 1967 次 3赞

鹿特丹丹的个人频道

+关注

从中美AI大模型的差距谈起
匿名

ChatGPT3.5 刚推出的时候，中国的百度等公司表示，它们的大模型就比美国的晚三个月。今天， OpenAI SORA横空出世，中国的大tech公司哑然失声。有人估计中国的AI大模型已经被甩开几年。这可能不是耸人听闻。

大模型的supervised 训练的设计很有讲究。搞得好，它会引导机器有效地深入地掌握人类知识的方方面面，培养逻辑推理能力等 AGI 的硬核能力。搞不好， supervised 训练会让机器迷失在浩瀚的知识海洋里，变成人工智障。中国的AI公司需要好好看看它们的大模型是往那个方向去。

普通人可能对此缺乏认识，以为喂同样的知识给机器，就会产生同样的智能。事情不是这么简单。一个类比是，一本同样的教科书，给一拨人学习，不同的人对书本掌握理解的程度相差很大：有的人了如指掌，有的人如坠云雾。

一个有启发性的例子如下。哈佛博士陈琳当年作为计算机大二生，用三个月时间，自己喂自己包括量子力学在内的物理专业核心教科书，在学校的选拔考试中脱颖而出，甩开物理系师生，被推荐参加丁肇中研究生招考。而许多物理系学生读了四年到毕业，都没能掌握量子力学。虽然他们看的是同一本书。

现在有一种可能性是， openai 的大模型开挂了，扬帆而去，像当年的大二生陈琳；而中国的大模型，更像几年都没读懂量子力学的学生。虽然，大模型的神经网络构架是一样的，虽然参数估计的算法是公开的。

差别在于supervised 学习的设计。设计好的supervised 学习方法，对开发者的学术背景有很高的要求。开发者最好能掌握多个专业知识，并且融会贯通。

比如 SORA团队的领导人，Tim Brooks ，就具有多个专业背景。他是加州伯克利计算机博士，演员（曾在百老汇演出），摄影师（获得国家地理杂志奖）。显然是一个专业精湛，兴趣广泛，心智非常活泼的人。

中国缺的就是这种领军型人才。专业精湛的，大多兴趣狭窄，除了专业外，几乎一无所知。兴趣广泛点的，流于肤浅。上文提到的哈佛博士是个例外。他既精湛又广博，拥有中美最好大学的计算机，天体物理，计算社会学，公共管理等不同专业学位，同时还是一个专业画师。这样的人，是今天第四次工业革命的佼佼者。中国的AI大模型，先是落后几个月，继而落后几年，缺的就是像陈博士这样的人。阿里，腾讯，百度，如果请他出山领导AI团队，则有望收复失地，迎头赶上。

喜欢鹿特丹丹朋友的这个贴子的话，