智能体(AI Agent):企业该如何实践
1. 概述
AI Agent 可以翻译为人工智能代理或智能体,下文为了概念一致,统一将 AI Agent 描述为智能体。
Open AI 、Google、Microsoft 还有国内如阿里、百度等一些厂商对智能体定义及智能体各部分组成结构等都有各自的解释,各厂商的概念整体上是相同的,个别地方有细微差别。下文结合 Open AI 和 Google 的定义作说明。
2. 什么是智能体
AI 智能体的核心是大语言模型 (LLM),因此,AI 智能体通常也称为大语言模型智能体。它是能够代表用户独立完成任务的系统(或应用程序),可执行一系列步骤以实现用户目标。它利用大语言模型来管理工作流程的执行并做出决策。它能够识别工作流程何时完成,并且在必要时可以主动纠正自身行为。失败时,它可以暂停执行并将控制权交回给用户。它可以使用各种工具与外部系统进行交互,既可以收集上下文信息,也可以采取行动。并且,它会根据工作流的当前状态动态选择合适的工具,并在明确界定的安全策略保护范围内运行。
例如,组织可能会构建一个费用管理智能体来帮助员工管理费用报销。费用管理智能体可以使用大语言模型与公司支出政策文档相结合来回答员工关于可以报销哪些费用以及有哪些限制的问题。此外,费用管理智能体还可以使用编程函数根据报销金额自动提交定期重复费用(例如每月手机账单),或根据报销金额智能地将费用流转到适当的审批者。
上图显示了以下过程:
-
员工向费用管理智能体询问可以报销的费用问题。
-
费用管理智能体接受问题并将其作为大语言模型的提示(Prompt)。
-
费用管理智能体检索包含公司一系列费用政策等信息的知识库作为提示的依据。
-
有依据的提示将提交到费用管理智能体的大语言模型,以生成响应,会在响应中提供相关的政策文档链接。
-
费用管理智能体代表用户生成费用单据,并将其提交以进行处理。
在更复杂的情境中,组织可以开发多智能体解决方案,其中多个智能体协调它们之间的协作。 例如,旅行预订智能体可以为员工预订航班和酒店,并自动向费用管理智能体提交带发票的费用单据,如下图所示:
此图显示了以下过程:
-
用户向旅行预订智能体提供即将旅行的详细信息。
-
旅行预订智能体自动预订机票和预订酒店。
-
旅行预订智能体通过费用智能体为差旅费用发起费用报销。
-
费用智能体提交费用报销进行处理。
3. 企业何时需要构建智能体解决方案
一些确定性的解决方案,即传统的工作流引擎或规则引擎就像一个检查表,根据预设条件进行决策。当企业考虑是否需要构建智能体解决方案时,首先要考虑传统的确定性的解决方案是否可以满足,当不能很好的满足需求时,再考虑智能体解决方案。
智能体的核心是大语言模型,大语言模型智能体的工作方式更像一位经验丰富的调查员,评估上下文背景情况,利用推理能力能够有效处理复杂、模糊情况。如涉及以下几项需求,则考虑构建智能体解决方案,
-
复杂决策:涉及微妙判断、特殊情况或上下文敏感决策的工作流,例如客户服务工作流中的退款审批。
-
规则难以维护:由于规则集广泛且复杂,导致系统难以管理,更新成本高或容易出错,例如对供应商的一些评估审查。
-
严重依赖非结构化数据:涉及解读自然语言、从文档中提取含义或与用户进行对话交互的场景,例如处理家庭保险理赔。
4. 智能体的组成
为了理解智能体的内部运作机制,我们可以把驱动智能体行为、行动和决策的基本组成部分描述为一种认知架构,智能体的认知架构中有三个基本组成部分。