人工智能署理是未来

显示全部楼层 · 2024-3-17 18:04:07

一家名为Cognition AI的始创公司宣布了一份演示，展示了一个名为Devin的人工智能法度模范执行通常由高薪软件工程师完成的工作，引起了不小的轰动。像ChatGPT和Gemini这样的聊天机器人可以生成代码，但Devin更进一步，计划如何解决问题，编写代码，然后测试和实现它。

Devin的创造  者将其标榜为“人工智能软件开发商”。当被要求测试Meta的开源语言模型Llama 2在通过不合  的托管公司拜访时的表示时，Devin为项目制定了一个分步计划，生成了拜访 api和运行基准测试所需的代码，并创建  了一个总结结果的网站。

我们总是很难去判断阶段性的演示，然则《认知》已经向我们展示了Devin所处理  的各类令人印象深刻的任务。它在X上惊艳了投资者和工程师，获得了年夜量的认可，甚至激发了一些脸色包——包含一些预测Devin将很快负责科技行业的裁人浪

Devin只是一个最新的、最完美的例子，我已经跟踪了一段时间——人工智能署理的涌现，它不仅仅是对人类提出的问题提供谜底或建议，而是采取  行动来解决问题。几个月前，我测试了Auto-GPT，这是一个开源法度模范，它试图通过在小我电脑和网络上执行操作来完成一些有用的琐事。最近，我测试了另一个名为vimGPT的法度模范，以了解新的人工智能模型的视觉技能如何赞助这些署理更有效地浏览网页。

我对那些特工的实验印象深刻。然而，就目前而言，就像支持它们的语言模型一样，它们也会犯一些毛病。并且，当一个软件正在执行操作，而不仅仅是生成文本时，一个毛病就可能意味着彻底失败，并可能导致价值昂扬或危险的后果。缩小署理可以完成的任务范围  ，比如  一组特定的软件工程杂务，似乎是降低毛病率的一种聪慧办法，但依旧有许多潜在的失败方法。

不仅仅是始创公司在开发人工智能署理。本周早些时候，我写了一篇关于由谷歌DeepMind开发的名为SIMA的智能体的文章，它可以玩电子游戏，包含真正猖狂的游戏《模拟山羊3》(Goat Simulator 3)。SIMA通过不雅察人类玩家学会了如何完成600多个相当庞杂的任务，比如  砍树或射击小行星。最重要的是，即使是在一款不熟悉的游戏中，它也能够胜利地执行这些操作。谷歌DeepMind称其为“通才”。

我怀疑谷歌希望这些署理最终能够在电子游戏之外工作，也许可以赞助用户使用网络或为他们操作软件。但电子游戏提供了一个很好的开发和测试署理的沙盒，它提供了可以测试和改进  署理的庞杂环境。“让它们更精确是我们正在积极努力的事情，”谷歌DeepMind的研究科学家蒂姆·哈雷(Tim Harley)告诉  我。“我们有很多想法。”

在接下来的几个月里，你可以期待更多关于人工智能署理的新闻。谷歌DeepMind的首席执行官德米斯·哈萨比斯(Demis Hassabis)最近告诉  我，他计划将年夜型语言模型与他的公司之前训练人工智能法度模范玩电子游戏的工作结合起来，以开发更有能力、更可靠的智能体。“这绝对是一个巨年夜的领域。我们在这个偏向上投入了年夜量资金，我想其他公司也一样。”哈萨比斯说。“当这些系统开始变得更像署理时，这将是这些系统能力的一个步调变更。”

人工智能署理 是未来

人工智能署理是未来