AI 智能体卷爆大模型AutoGPT 等 4 大 Agent 打擂「西部世界」谁将成为软件 20

人工智能‌ 23
  它们是一种自动的智能体,以最简单的形式中在循环中运行,每次迭代时,它们都会生成自我导向的指令和操作。因此,它们不依赖人类来指导对话,并且是高度可扩展的。   这也引起了无数 AI 大佬和科技巨头的兴趣。今年加入 OpenAI 的大牛、前特斯拉 AI 总监 Karpathy 近日就在一次开发者活动上表示:AI 智能体,代表了 AI 的一种未来!

  它们是一种自动的智能体,以最简单的形式中在循环中运行,每次迭代时,它们都会生成自我导向的指令和操作。因此,它们不依赖人类来指导对话,并且是高度可扩展的。

  这也引起了无数 AI 大佬和科技巨头的兴趣。今年加入 OpenAI 的大牛、前特斯拉 AI 总监 Karpathy 近日就在一次开发者活动上表示:AI 智能体,代表了 AI 的一种未来!

  其实,早在今年三、四月,就有过一轮 AI 智能体的大爆发,仿佛巧合一样,在短短两周内,斯坦福西部世界小镇、BabyAGI、AutoGPT 等多个智能体,就如雨后春笋一般冒出来。

  甚至有人发出号召:别卷大语言模型了,咱们是卷不过 OpenAI 的,但要说起 AI 智能体,他们并不比我们有经验多少。

  5 月 27 日,英伟达 AI 智能体 Voyager 接入 GPT-4 后,直接完胜了 AutoGPT。通过自主写代码,它完全独霸了《我的世界》,可以在游戏中进行全场景的终身学习,根本无需人类插手。

  就在同一时间,商汤、清华等共同提出了通才 AI 智能体 Ghost in the Minecraft (GITM),它同样能够通过自主学习解决任务,表现优异。

  对于前几个 AI 智能体,Anacondainc 数据科学家、Sophia Yang 博士,就曾在博客中给出过全面分析。

  这几个 AI 智能体中,最吸引眼球的,无疑就是一经推出就爆火的,斯坦福和谷歌的研究者共同创建的西部世界小镇了。

  这是一个交互式的沙盒环境,在小镇上,生活着 25 个可以模拟人类行为的生成式 AI 智能体。

  比如,从一个简单的用户指定概念(一个智能体想举办情人节派对)开始,这些智能体在接下来的两天里,会自动传播派对邀请的消息,结识新朋友,互相约对方一起去派对,还会彼此协调时间,在正确的时间一起出现在派对上。

  观察可以是智能体执行的行为,也可以是智能体从其他人那里感知到的行为。记忆流很长,但并不是所有观察都是重要的。

  3. 相关性:与情境相关的记忆,即查询记忆。例如,在讨论如何为化学考试学习时,学校作业记忆更重要。

  反思会定期产生以下两个问题:「关于陈述中的主题,我们可以回答哪 3 个最突出的高层次问题?,你能从上述陈述中推断出哪 5 个高层次的见解?」

  规划很重要,因为行动不仅应该集中在当下,而且应该集中在更长的时间范围内,这样,行动才能够连贯和可信。

  规划同样存储在记忆流中。智能体可以根据规划创建行动,并根据记忆流中的其他观察结果做出反应和更新计划。

  作为一个探索大语言模型社会「心智」的交流智能体,它提出了一个角色扮演智能体框架,可以实现两个人工智能智能体的交流:

  3)任务指定智能体:这个智能体的作用,是为 AI 用户和 AI 助手构思一个具体的任务。这样,它就可以自主编写一个具体的任务提示,而不用用户去花时间定义了。

  任务指定智能体首先提出一个具体的任务,并给出任务的详细信息(根据情感分析结果监控社交媒体情感,并根据情感分析结果进行股票交易)。

  然后,AI 用户智能体成为任务规划者,AI 助手智能体成为任务执行者,并在一个循环中相互提示,直到满足一些终止条件。

  这些提示实际上是经过精心定义的,用于分配角色,防止角色反转,禁止生成有害和虚假的信息,并鼓励连贯的对话。

  在 LangChain 的实现中,用的是 Camel 论文中给出的提示,并定义了三个智能体:

  不过,在 Camel 中,AI 助手的执行结果只是语言模型的回答,而没有真正使用任何工具来运行 Python 代码。

  利用 Camel,一个人类程序员,一个人类游戏玩家,就和两个 AI 智能体一起,合作创建了一个游戏。

  这个项目的目标是两个「碳奸」要渗透并破坏世界主要国家的通讯,金融和政治网络,最后建立 AGI 帝国。

  「碳奸」2 说他要用社会工程,钓鱼攻击,等办法去进入通讯网络 —— 基本上还是没有什么可操作性。

  但是未来如果语言模型等其他工具有了更强的智能,可能两个「碳奸」颠覆人类的计划搞不好就真的有可能实现。

  如果这种恶意智能体真的能发挥效果,人类被「偷家」也就是一瞬间的事。这就更让我们对 AI 对齐问题感到警醒。

  通过 Langchain,可以定义最大迭代次数,这样它就不会无限运行并消耗掉所有的 OpenAI API 额度。

  借助 LangChain 工具的强大功能,智能体可以在「执行」过程中利用各种工具,例如用谷歌在互联网上搜索信息。

  这是一个自动执行每日任务清单的智能体,能在连接了 ChatGPT 之后帮助用户自动执行每日代办事项。

  需要用户绑定自己的 GPT 账户 API 之后,在这个类似 ChatGPT 的界面中输入的要求。

  它遵循类似于 BabyAGI 的逻辑 —— 包括产生想法、推理、生成计划、点评、规划下一步行动和执行的过程,然后无限循环这个过程。

  在执行步骤中,AutoGPT 可以完成很多命令,比如谷歌搜索、浏览网站、写入文件和执行 Python 文件。

  当它想要运行谷歌命令时,它会请求授权,这样用户就可以避免浪费 OpenAI API token 之前就停止循环。

  同样,这个项目也是由 ChatGPT 驱动,它会自动按照用户的要求去写代码,以及完成其他工作。

  虽然刚刚介绍的这 4 个 AI 智能体,仍处于早期开发阶段,但它们已经展示出了令人印象深刻的成果和潜在应用。

  Karpathy 在活动中畅想道:未来的 AI 智能体可能不是单独的个体,而是非常多的 AI 智能体组织,甚至,会出现一种 AI 智能体文明。

  Karpathy 表示,在 2016 年左右,自己早期在 OpenAI 工作时,当时的业界潮流就是研究如何用强化学习来改进 AI 智能体。

  而 5 年后的今天,因为有了全新的技术手段,AI 智能体重新成为了大有前途的方向。再也没有人像 2016 年那样,用强化学习来研究智能体了。

  在活动最后,Karpathy 对在场的开发者发起了鼓舞:在座的各位构建的 AI 智能体,其实处于当代 AI 智能体的最前沿,比起你们,其他大型的 LLM 机构,比如 OpenAI、DeFi 等,并不算处于最前沿。

  比如,OpenAI 非常擅长训练 Transformer 大语言模型,如果一篇论文提出了某种不同的训练方法,OpenAI 内部会觉得是小 case,都是咱们玩剩下的。

  然而,每当有新的 AI 智能体论文出现,OpenAI 内部都会非常兴奋,立刻展开热烈的讨论。

  如果没有在做 GPT-5,那 OpenAI 是不是正在暗中发力,做起了大模型智能体呢?让我们静静等待。

  PS:顺便一提,关于在上述智能体中大显身手的 LangChain,吴恩达今日刚刚上线了新课程《LangChain:构建与数据对话的聊天机器人》。

  广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

扫码二维码