中美AI大模型的差距
从中美AI大模型的差距谈起
匿名ChatGPT3.5 刚推出的时候, 中国的百度等公司表示, 它们的大模型就比美国的晚三个月。 今天, OpenAI SORA横空出世, 中国的大tech公司哑然失声。有人估计中国的AI大模型已经被甩开几年。这可能不是耸人听闻。大模型的supervised 训练的设计很有讲究。 搞得好,它会引导机器有效地深入地掌握人类知识的方方面面,培养逻辑推理能力等 AGI 的硬核能力。搞不好, supervised 训练会让机器迷失在浩瀚的知识海洋里, 变成人工智障。中国的AI公司需要好好看看它们的大模型是往那个方向去。普通人可能对此缺乏认识, 以为喂同样的知识给机器, 就会产生同样的智能。事情不是这么简单。一个类比是,一本同样的教科书, 给一拨人学习, 不同的人对书本掌握理解的程度相差很大: 有的人了如指掌, 有的人如坠云雾。一个有启发性的例子如下。哈佛博士陈琳当年作为计算机大二生, 用三个月时间, 自己喂自己包括量子力学在内的物理专业核心教科书, 在学校的选拔考试中脱颖而出,甩开物理系师生, 被推荐参加丁肇中研究生招考。而许多物理系学生读了四年到毕业,都没能掌握量子力学。虽然他们看的是同一本书。现在有一种可能性是, openai 的 大模型开挂了, 扬帆而去,像当年的大二生陈琳; 而中国的大模型,更像几年都没读懂量子力学的学生。虽然,大模型的神经网络构架是一样的, 虽然参数估计的算法是公开的。差别在于supervised 学习的设计。设计好的supervised 学习方法, 对开发者的学术背景有很高的要求。开发者最好能掌握多个专业知识, 并且融会贯通。比如 SORA团队的领导人,Tim Brooks ,就具有多个专业背景。他是加州伯克利计算机博士,演员( 曾在百老汇演出),摄影师( 获得国家地理杂志奖) 。显然是一个专业精湛, 兴趣广泛, 心智非常活泼的人。中国缺的就是这种领军型人才。专业精湛的, 大多兴趣狭窄, 除了专业外, 几乎一无所知。兴趣广泛点的, 流于肤浅。上文提到的哈佛博士是个例外。他既精湛又广博,拥有中美最好大学的计算机, 天体物理, 计算社会学, 公共管理等不同专业学位, 同时还是一个专业画师。这样的人,是今天第四次工业革命的佼佼者。中国的AI大模型, 先是落后几个月,继而落后几年, 缺的就是像陈博士这样的人。阿里,腾讯, 百度, 如果请他出山领导AI团队, 则有望收复失地, 迎头赶上。
内容来自网友分享,若违规或者侵犯您的权益,请联系我们
所有跟帖: ( 主贴楼主有权删除不文明回复,拉黑不受欢迎的用户 )
楼主前期社区热帖:
>>>>查看更多楼主社区动态...