无法解释的人钙 发表于 2024-3-17 18:04:07

人工智能署理 是未来

一家名为Cognition AI的始创 公司宣布 了一份演示,展示了一个名为Devin的人工智能法度模范   执行通常由高薪软件工程师完成的工作,引起了不小的轰动。像ChatGPT和Gemini这样的聊天机器人可以生成代码,但Devin更进一步,计划如何解决问题,编写代码,然后测试和实现它。

Devin的创造者将其标榜为“人工智能软件开发商”。当被要求测试Meta的开源语言模型Llama 2在通过不合的托管公司拜访 时的表示 时,Devin为项目制定了一个分步计划,生成了拜访 api和运行基准测试所需的代码,并创建了一个总结结果的网站。

我们总是很难去判断阶段性的演示,然则 《认知》已经向我们展示了Devin所处理的各类 令人印象深刻的任务。它在X上惊艳了投资者和工程师,获得了年夜 量的认可,甚至激发了一些脸色 包——包含 一些预测Devin将很快负责科技行业的裁人 浪

Devin只是一个最新的、最完美的例子,我已经跟踪了一段时间——人工智能署理 的涌现 ,它不仅仅是对人类提出的问题提供谜底 或建议,而是采取行动来解决问题。几个月前,我测试了Auto-GPT,这是一个开源法度模范   ,它试图通过在小我 电脑和网络上执行操作来完成一些有用的琐事。最近,我测试了另一个名为vimGPT的法度模范   ,以了解新的人工智能模型的视觉技能如何赞助 这些署理 更有效地浏览网页。

我对那些特工的实验印象深刻。然而,就目前而言,就像支持它们的语言模型一样,它们也会犯一些毛病 。并且 ,当一个软件正在执行操作,而不仅仅是生成文本时,一个毛病 就可能意味着彻底失败,并可能导致价值 昂扬 或危险的后果。缩小署理 可以完成的任务范围,比如一组特定的软件工程杂务,似乎是降低毛病 率的一种聪慧 办法 ,但依旧有许多潜在的失败方法 。

不仅仅是始创 公司在开发人工智能署理 。本周早些时候,我写了一篇关于由谷歌DeepMind开发的名为SIMA的智能体的文章,它可以玩电子游戏,包含 真正猖狂 的游戏《模拟山羊3》(Goat Simulator 3)。SIMA通过不雅 察人类玩家学会了如何完成600多个相当庞杂 的任务,比如砍树或射击小行星。最重要的是,即使是在一款不熟悉的游戏中,它也能够胜利 地执行这些操作。谷歌DeepMind称其为“通才”。

我怀疑谷歌希望这些署理 最终能够在电子游戏之外工作,也许可以赞助 用户使用网络或为他们操作软件。但电子游戏提供了一个很好的开发和测试署理 的沙盒,它提供了可以测试和改进署理 的庞杂 环境。“让它们更精确是我们正在积极努力的事情,”谷歌DeepMind的研究科学家蒂姆·哈雷(Tim Harley)告诉我。“我们有很多想法。”

在接下来的几个月里,你可以期待更多关于人工智能署理 的新闻。谷歌DeepMind的首席执行官德米斯·哈萨比斯(Demis Hassabis)最近告诉我,他计划将年夜 型语言模型与他的公司之前训练人工智能法度模范   玩电子游戏的工作结合起来,以开发更有能力、更可靠的智能体。“这绝对是一个巨年夜 的领域。我们在这个偏向 上投入了年夜 量资金,我想其他公司也一样。”哈萨比斯说。“当这些系统开始变得更像署理 时,这将是这些系统能力的一个步调 变更 。”
页: [1]
查看完整版本: 人工智能署理 是未来