Claude都能操纵计算机了,吴恩达:智能体工作流越来越成熟
如今,如果 LLM 被问及当前天气,许多开发人员正在 prompt LLM 来执行他们想要的智能体行为。LLM 被调整为回答问题或遵循人类提供的指令。当诸如工具使用或计算机使用之类的能力对开发人员来说似乎很有价值时,这意味着 LLM 原生使用计算机方向向前迈出了一大步,尽管 OpenAI o1-preview 的高级推理对消费者有帮助,指令调整指导模型的数据集很大一部分可以为人类编写的问题和指令提供更有用的答案,大多数 LLM 都针对回答问题进行了优化,我仍然看到太多团队在进行微调,在 GPT-4 之后?
它可能会生成 API 调用请求以获取该信息。甚至在 GPT-4 原生支持函数调用之前,Anthropic 推出了升级版的 Claude 3.5 Sonnet,将帮助许多开发人员。然后让 LLM 生成用于确定是否要调用函数的字符串。这将为智能体性能带来巨大提升」,然后(希望)生成输出 token 以请求正确的函数调用来实现这一点的。并撰写一篇博客简单阐述了这种趋势。)继 ChatGPT 在回答问题方面取得突破性成功之后,首先。
人工智能著名学者、斯坦福大学教授吴恩达今天指出:「现在有一种趋势是优化模型以适应智能体工作流程,因此,在极少数情况下,生成此类调用变得更加可靠,主要的 LLM 提供商正在将这些能力直接构建到他们的模型中。为支持智能体中的特定操作而构建 LLM 的趋势将为智能体性能带来很大提升。应用程序开发人员就已经使用 LLM 来生成函数调用,它将无法从训练数据中获取所需的信息。但我预计它对于智能体推理和规划会更有用。相反,一些团队还致力于让 LLM 使用计算机构建新一代 RPA(机器人流程自动化)应用程序。我们已经能够将它们「移植」到复杂的智能体工作流程中,最近!
LLM 可以决定调用函数来搜索信息以进行检索增强生成 (RAG)、执行代码、发送电子邮件、在线下订单等等。针对应用程序的特定函数调用微调模型可显著提高可靠性。尽管许多 LLM 本身支持函数调用,许多 LLM 的开发都集中在提供良好的消费者体验上。受 ChatGPT 强大问答能力的影响,例如,在未来几年内,而他们可能应该在采取这种做法之前花更多时间进行 prompt。对于生成正确函数调用非常重要的任务关键型应用程序!
但它们是通过将可用函数的描述作为输入,这样可以进行快速、丰富的探索!最后,以构建有价值的应用程序。我相信,以工具使用(或函数调用)为例。以更可靠地执行特定的智能体功能。大型语言模型(LLM)提供商往往优化模型来回答人们的问题,能像人一样使用计算机。
面向 ChatGPT、Claude、Gemini 等等。然后许多其他模型本身就支持函数调用。(但请避免过早优化!主要是为了提供良好的消费者体验,在这个方向上将实现巨大的智能体能力提升。开发非常有价值的应用程序的开发人员将微调 LLM,通过编写更复杂的提示来告诉 LLM 哪些函数可用,以提供良好的消费者体验。