人工智能署理 是未来

[复制链接]
查看321 | 回复0 | 2024-3-17 18:04:07 | 显示全部楼层 |阅读模式
一家名为Cognition AI的始创 公司宣布 了一份演示,展示了一个名为Devin的人工智能法度模范   执行通常由高薪软件工程师完成的工作,引起了不小的轰动。像ChatGPT和Gemini这样的聊天机器人可以生成代码,但Devin更进一步,计划如何解决问题,编写代码,然后测试和实现它。

Devin的创造  者将其标榜为“人工智能软件开发商”。当被要求测试Meta的开源语言模型Llama 2在通过不合  的托管公司拜访 时的表示 时,Devin为项目制定了一个分步计划,生成了拜访 api和运行基准测试所需的代码,并创建  了一个总结结果的网站。

我们总是很难去判断阶段性的演示,然则 《认知》已经向我们展示了Devin所处理  的各类 令人印象深刻的任务。它在X上惊艳了投资者和工程师,获得了年夜 量的认可,甚至激发了一些脸色 包——包含 一些预测Devin将很快负责科技行业的裁人 浪

Devin只是一个最新的、最完美的例子,我已经跟踪了一段时间——人工智能署理 的涌现 ,它不仅仅是对人类提出的问题提供谜底 或建议,而是采取  行动来解决问题。几个月前,我测试了Auto-GPT,这是一个开源法度模范   ,它试图通过在小我 电脑和网络上执行操作来完成一些有用的琐事。最近,我测试了另一个名为vimGPT的法度模范   ,以了解新的人工智能模型的视觉技能如何赞助 这些署理 更有效地浏览网页。

我对那些特工的实验印象深刻。然而,就目前而言,就像支持它们的语言模型一样,它们也会犯一些毛病 。并且 ,当一个软件正在执行操作,而不仅仅是生成文本时,一个毛病 就可能意味着彻底失败,并可能导致价值 昂扬 或危险的后果。缩小署理 可以完成的任务范围  ,比如  一组特定的软件工程杂务,似乎是降低毛病 率的一种聪慧 办法 ,但依旧有许多潜在的失败方法 。

不仅仅是始创 公司在开发人工智能署理 。本周早些时候,我写了一篇关于由谷歌DeepMind开发的名为SIMA的智能体的文章,它可以玩电子游戏,包含 真正猖狂 的游戏《模拟山羊3》(Goat Simulator 3)。SIMA通过不雅 察人类玩家学会了如何完成600多个相当庞杂 的任务,比如  砍树或射击小行星。最重要的是,即使是在一款不熟悉的游戏中,它也能够胜利 地执行这些操作。谷歌DeepMind称其为“通才”。

我怀疑谷歌希望这些署理 最终能够在电子游戏之外工作,也许可以赞助 用户使用网络或为他们操作软件。但电子游戏提供了一个很好的开发和测试署理 的沙盒,它提供了可以测试和改进  署理 的庞杂 环境。“让它们更精确是我们正在积极努力的事情,”谷歌DeepMind的研究科学家蒂姆·哈雷(Tim Harley)告诉  我。“我们有很多想法。”

在接下来的几个月里,你可以期待更多关于人工智能署理 的新闻。谷歌DeepMind的首席执行官德米斯·哈萨比斯(Demis Hassabis)最近告诉  我,他计划将年夜 型语言模型与他的公司之前训练人工智能法度模范   玩电子游戏的工作结合起来,以开发更有能力、更可靠的智能体。“这绝对是一个巨年夜 的领域。我们在这个偏向 上投入了年夜 量资金,我想其他公司也一样。”哈萨比斯说。“当这些系统开始变得更像署理 时,这将是这些系统能力的一个步调 变更 。”
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

1

主题

1

回帖

15

积分

新手上路

Rank: 1

积分
15