从生成式人工智能，到代理AI：AI 寻求突破 -6park.com

[返回渔樵笑谈首页]·[所有跟帖]·[ 回复本帖 ] ·[热门原创] ·[繁體閱讀]·[坛主管理]

从生成式人工智能，到代理AI：AI 寻求突破

送交者: 峻声[♂★★★声望勋衔13★★★♂] 于 2025-01-13 8:55 已读 1248 次 3赞

峻声的个人频道

+关注

英国《经济学人》周刊网站2024年12月11日发表报道，题为《生成式人工智能的诸神为2025年准备了什么？》，内容编译如下：

圣诞节的12天是从每年12月25日开始的，但在人工智能(AI)的世界里并非如此。2024年12月5日，ChatGPT的开发商美国开放人工智能研究中心(OpenAI)开启了“发布的12天”产品发布季，包括全面推出视频生成工具“天空”模型（Sora）以及写作和编码工具Canvas。

不甘落后的谷歌也赶快放出圣诞老人的小精灵们开始干活。2024年12月11日，谷歌推出了新的生成式AI模型Gemini 2.0，以及基于该模型的两个增强版AI产品Astra和Mariner。这些产品可以代表用户操作——即业内人士所说的“代理AI”。

这两家公司的公告中值得注意的一点是，产品比模型占据更重要的地位。虽然从事大语言模型研究的专家们正在努力开发智能的下一个前沿领域，但开发商们面临的压力是发布智能产品，以证明这些新技术是有市场的。

开发生成式AI产品存在各种困难。产品开发者通常从消费者需求出发，但生成式AI的发展太迅猛，以至于技术正在定义产品。OpenAI首席产品官凯文·韦尔说：“我们通常被教导，不要成为一把到处找钉子的锤子。但是，每隔两个月，计算机就能做到一些我们力所不及的事情。”

不过，这些最新发布的产品也有一些故障。OpenAI首席执行官萨姆·奥尔特曼说，公司在向ChatGPT用户发布Sora不久后不得不暂停服务，因为需求大到超出预期。Sora的用户虽然对产品感到惊艳，但也注意到，早期演示中的问题仍然存在。最明显的问题是Sora难以真实地描绘复杂动作。技术评论员马克斯·布朗利指出，Sora几乎无法真实地复现任何四条腿的生物，而且物体会随机消失。

谷歌的代理AI也尚未打磨好。目前仅向一小群“可信测试者”开放的Astra可以用几种语言解释它通过手机摄像头看到的内容，并且可以访问谷歌搜索和谷歌地图等网站。在一段拍摄著名画作的演示视频中，知识渊博的Astra对画作进行了介绍。然而，当《经济学人》要求它说出大多数原作展出的城市时，它却答不上来。谷歌另一个新的AI原型Mariner可以通过浏览器完成任务，例如在网络超市中把商品添加到购物车，但它不能自行结账。

硅谷对代理AI尤其寄予了厚望。攀登人工智能公司(Scale AI)的亚历克斯·王(音)表示，用代理AI实现从“聊天到做事”的转变可能是2025年的重大技术突破之一。这一希望已经提振了赛富时公司等软件巨头的股价。该公司表示，在2024年10月发布职场代理AI Agentforce后，公司在一周内已与200多个客户签署了协议，而该公司更大的竞争对手微软已经发布了多个代理AI。

然而，有几个因素导致代理AI比聊天机器人更难创建。其一是数据。不同于从网络抓取信息以回答问题的聊天机器人，代理AI需要获取关于执行任务方式的数据，包括行动的顺序和背后的推理。对于处理客户订单等常规活动，这些数据可能是现成的，但在许多情况下，很难找到足够的数据来训练这款工具。

第二个问题是信任。检查聊天机器人给出的答案是正确还是错误通常比较容易，而确定代理AI是否预订了你预算范围内最好的餐厅或假期行程可能更难。谷歌有意阻止Mariner花钱，以防它做出错误的决定。用户也可能不愿意向代理AI提供敏感信息(比如自己的购买历史)，而代理AI可能需要这些信息才能正常运作。

最后一个问题是成本。为了代表用户进行推理、规划和解决问题，代理AI需要访问能够处理复杂任务的模型，还需要低延迟、与浏览器等其他工具交互的能力，以及大量的内存，才能提供定制服务。这些能力都很难构建，不仅昂贵，还需要大量算力。

喜欢峻声朋友的这个贴子的话，