[返回爱GPT首页]·[所有跟帖]·[ 回复本帖 ] ·[热门原创] ·[繁體閱讀]·[坛主管理]

从中美AI大模型的差距谈起

送交者: 鹿特丹丹[☆★声望品衔8★☆] 于 2024-02-25 16:37 已读 1202 次 2赞  

鹿特丹丹的个人频道

+关注
从中美AI大模型的差距谈起

匿名

ChatGPT3.5 刚推出的时候, 中国的百度等公司表示, 它们的大模型就比美国的晚三个月。 今天, OpenAI SORA横空出世, 中国的大tech公司哑然失声。有人估计中国的AI大模型已经被甩开几年。这可能不是耸人听闻。

大模型的supervised 训练的设计很有讲究。 搞得好,它会引导机器有效地深入地掌握人类知识的方方面面,培养逻辑推理能力等 AGI 的硬核能力。搞不好, supervised 训练会让机器迷失在浩瀚的知识海洋里, 变成人工智障。中国的AI公司需要好好看看它们的大模型是往那个方向去。

普通人可能对此缺乏认识, 以为喂同样的知识给机器, 就会产生同样的智能。事情不是这么简单。一个类比是,一本同样的教科书, 给一拨人学习, 不同的人对书本掌握理解的程度相差很大: 有的人了如指掌, 有的人如坠云雾。

一个有启发性的例子如下。哈佛博士陈琳当年作为计算机大二生, 用三个月时间, 自己喂自己包括量子力学在内的物理专业核心教科书, 在学校的选拔考试中脱颖而出,甩开物理系师生, 被推荐参加丁肇中研究生招考。而许多物理系学生读了四年到毕业,都没能掌握量子力学。虽然他们看的是同一本书。

现在有一种可能性是, openai 的 大模型开挂了, 扬帆而去,像当年的大二生陈琳; 而中国的大模型,更像几年都没读懂量子力学的学生。虽然,大模型的神经网络构架是一样的, 虽然参数估计的算法是公开的。

差别在于supervised 学习的设计。设计好的supervised 学习方法, 对开发者的学术背景有很高的要求。开发者最好能掌握多个专业知识, 并且融会贯通。

比如 SORA团队的领导人,Tim Brooks ,就具有多个专业背景。他是加州伯克利计算机博士,演员( 曾在百老汇演出),摄影师( 获得国家地理杂志奖) 。显然是一个专业精湛, 兴趣广泛, 心智非常活泼的人。

中国缺的就是这种领军型人才。专业精湛的, 大多兴趣狭窄, 除了专业外, 几乎一无所知。兴趣广泛点的, 流于肤浅。上文提到的哈佛博士是个例外。他既精湛又广博,拥有中美最好大学的计算机, 天体物理, 计算社会学, 公共管理等不同专业学位, 同时还是一个专业画师。这样的人,是今天第四次工业革命的佼佼者。中国的AI大模型, 先是落后几个月,继而落后几年, 缺的就是像陈博士这样的人。阿里,腾讯, 百度, 如果请他出山领导AI团队, 则有望收复失地, 迎头赶上。
贴主:鹿特丹丹于2024_02_25 17:26:53编辑
喜欢鹿特丹丹朋友的这个贴子的话, 请点这里投票,“赞”助支持!

内容来自网友分享,若违规或者侵犯您的权益,请联系我们

所有跟帖:   ( 主贴楼主有权删除不文明回复,拉黑不受欢迎的用户 )


用户名: 密码: [--注册ID--]

标 题:

粗体 斜体 下划线 居中 插入图片插入图片 插入Flash插入Flash动画


     图片上传  Youtube代码器  预览辅助



[ 留园条例 ] [ 广告服务 ] [ 联系我们 ] [ 个人帐户 ] [ 创建您的定制新论坛频道 ] [ Contact us ]