生成AI应用的代理框架 - 分析Vidhya-人工智能-PHP中文网

首页

科技周边

人工智能

生成AI应用的代理框架 - 分析Vidhya

尊渡假赌尊渡假赌尊渡假赌

Apr 13, 2025 am 11:13 AM

想象一下，拥有一个由AI驱动的助手，不仅可以响应您的查询，还可以自主收集信息，执行任务甚至处理多种类型的数据（TEXT，图像和代码）。听起来有未来派？在本文中，我们深入研究Autogen框架，这是一种尖端的技术，使您能够构建如此聪明的多模式对话代理。无论您是想自动化业务开发任务，例如Web刮擦和汇总内容，甚至通过人类监督执行代码，本指南都会使您浏览每个步骤。如果您有兴趣利用AI创建强大的自我管理代理，那么这是必读的！

本文基于2024年TheDatahack Summit在Genai应用程序中的最近对Genai应用的框架进行的演讲。

学习成果

了解代理AI的核心概念和组成部分。
与代理AI相比，了解传统AI的好处和局限性。
探索工具和系统在增强AI代理能力方面的作用。
发现多代理系统的应用和潜在影响。
检查代理AI的道德考虑和未来趋势。

什么是代理AI？
为什么代理AI很重要？
- 动态互动和自主权
- 增强知识整合
- 动作执行能力
- 复杂的任务处理
了解AI代理的组件
- 用户请求
- 代理人
- 记忆
- 工具
- 规划
什么是单个代理系统？
代理商的工具
- 向量数据库
- 网络搜索
- 代码执行
- 外部API
什么是多代理系统？
- 多代理系统的主要好处
- 多代理系统中的工具使用
两个代理系统 - 反射
多代理系统 - 组聊天
了解代理框架
代理框架 - Phidata
代理框架 - CREWAI
代理框架 - 自动源
代理AI的用例
- 协作多代理编码
- 动态的小组聊天
- 象棋等对话游戏
- 使用自定义工具执行复杂的任务
代理AI的未来
代理AI的道德考虑
代理AI对社会的潜在影响
结论
常见问题

什么是代理AI？

代理AI是指旨在具有一定程度的自主权和代理的人工智能系统。与主要在人类直接监督下运行的传统AI模型不同，Agesic AI框架是为处理复杂的，现实世界中的任务而构建的。这些系统能够管理各种组件，例如对话代理，Web搜索工具和代码执行环境。他们使用高级技术来处理多种类型的数据，即文本，图像，甚至可执行的代码，以使它们执行复杂的功能，例如收集信息，与用户交互以及实时执行任务。

生成AI应用的代理框架 - 分析Vidhya

代理AI的一个突出例子是Autogen框架，该框架支持能够搜索网络，汇总内容和执行代码的智能代理的开发。该框架为建筑代理提供了一种结构化方法，该方法可以处理多模式输入和复杂的对话模式，使其成为希望自动化复杂流程的开发人员和企业的宝贵工具。

另请阅读：深入了解Langchain的代理框架

为什么代理AI很重要？

现在让我们了解为什么代理AI很重要。

动态互动和自主权

与传统的大型语言模型（LLMS）不同，该模型以零拍模式产生响应，代理人动态交互。传统的LLM基于提示输入而创建令牌，而无需重新访问或修改其输出的能力。相反，代理可以不断地完善其反应。他们根据新信息，反馈或上下文中的变化来执行此操作。这允许更加自适应和自主的问题解决。

生成AI应用的代理框架 - 分析Vidhya

增强知识整合

LLM固有地受其预先存在的内部知识的限制，这可能不能涵盖所有相关或最新信息。但是，可以设计代理来访问和集成来自各种来源的实时数据，从而增强其提供准确和当前信息的能力。这使它们在最新知识至关重要的环境中更有效。

生成AI应用的代理框架 - 分析Vidhya

动作执行能力

传统的LLM缺乏执行操作的能力，例如运行代码或执行生成文本之外的特定任务。代理可以通过将功能合并到执行代码，与其他系统进行交互或直接执行复杂的操作来弥合此差距。此功能对于自动化任务和执行工作流程至关重要，而工作流不仅仅涉及生成文本。

生成AI应用的代理框架 - 分析Vidhya

复杂的任务处理

LLM通常不适合执行需要复杂过程或决策的复杂的多步骤任务。代理可以通过组合各种功能（例如访问外部数据库，与API进行交互以及执行顺序操作）来处理此类任务，从而使它们非常适合复杂且多方面的应用程序。

生成AI应用的代理框架 - 分析Vidhya

另请阅读：从头开始构建AI代理的综合指南

了解AI代理的组件

现在，我们将更深入地了解AI代理的组成部分。

用户请求

这就是一切开始的地方。用户提供了输入或提示，该输入或提示是代理操作的基础。与传统的AI模型可能以静态答案做出响应不同，代理旨在提取此请求并与环境动态交互，并根据用户说明调整其行为和输出。

代理人

该系统中的中心数字，代理处理用户请求并协调必要的操作。代理人自主行动以解释投入，管理资源并就如何进行的决定做出决定。这不仅仅是产生响应；这是关于了解目标并确定实现目标所需的步骤，通常是通过将复杂的任务分解为可管理的子任务。

生成AI应用的代理框架 - 分析Vidhya

记忆

记忆对于代理保留上下文并从以前的交互中学习至关重要。与传统的LLM在交互之间没有持久记忆的传统LLM不同，代理可以存储相关信息并根据需要召回它。这使他们可以跟踪用户的偏好，项目目标或正在进行的任务，从而创造更个性化和更连贯的体验。

工具

工具扩展了代理的功能，而不仅仅是生成文本。这些可能是代理可以访问完成任务的API，数据库，外部软件或系统。例如，代理可以使用代码执行工具运行程序，或者数据检索工具来收集实时信息。这些工具使代理商能够在现实世界中执行动作，从而增强其功能远远超出了静态响应。

规划

计划使代理可以将用户的请求分解为结构化步骤。代理人没有对复杂问题提供单一的回应，而是设计了一个行动计划。代理人预测要使用哪些工具，要回忆的信息以及最终结果应该是什么。这种系统的方法可确保代理可以处理需要多个阶段的任务。它使代理适用于更复杂和延长工作流程。

什么是单个代理系统？

在单个代理系统中，一个代理的任务是管理和满足用户请求。代理人负责理解输入，对其进行处理以及确定提供所需结果所需的步骤。这种集中模型允许代理人独立运作，一次以明确的目标为重点。

生成AI应用的代理框架 - 分析Vidhya

单代理系统的关键特征之一是工具使用情况。代理商配备了对各种外部工具的访问，以扩展其功能。例如，当出现需要编码的任务时，代理可以通过使用代码执行工具来执行代码。它还可以与API，数据库或外部软件进行交互，以收集信息，执行计算或生成输出。代理商根据任务要求选择适当的工具，并自主使用它们来实现目标。

生成AI应用的代理框架 - 分析Vidhya

单个代理系统确保在受控环境中有效地处理任务。这使其非常适合更直接和专注的工作流程。通过利用其内部记忆和外部工具，代理可以应对各种挑战。它在整个过程中保持连贯性和任务准确性。

代理商的工具

代理商依靠一系列工具将其功能扩展到其内部知识和处理能力之外。这些工具授权代理执行任务，检索信息并有效与外部系统进行交互。这是代理常用的一些关键工具：

生成AI应用的代理框架 - 分析Vidhya

向量数据库

矢量数据库在使代理能够以优化相似性搜索的格式存储，检索和处理大量信息方面起着至关重要的作用。当代理需要记住过去的交互，复杂的数据点或大数据集时，矢量数据库有助于快速基于相似性而不是确切匹配的相关信息。当代理处理自然语言输入或需要高级模式识别时，这一点特别有用。

网络搜索

Web搜索工具允许代理商从Internet访问实时信息，扩展其知识库，而不是预先存在的内部数据。当面对需要最新更新，事实或见解的问题或任务时，代理可以执行网络搜索以收集相关内容。该功能对于解决问题的动态问题至关重要，使代理能够适应新信息并在现实世界中准确做出响应。

代码执行

代码执行工具使代理可以作为解决问题的过程的一部分编写，测试和运行代码。对于涉及编程的任务，例如生成脚本或自动化工作流程，代理可以实时执行代码。这种能力使代理商可以应对复杂的技术挑战。这些包括调试，软件开发和自动化。

外部API

代理使用外部API（应用程序编程接口）与各种系统，服务和平台进行交互。通过访问外部API，代理可以检索数据，触发操作或与其他软件进行通信。无论是获取天气数据，启动金融交易，还是与企业系统集成，API都可以作为桥梁，使代理商可以在不同的领域和行业跨行业执行专业任务。

什么是多代理系统？

多代理系统（MAS）将多个代理人聚集在一起，每个代理都以专业的技能或角色进行协作，以解决超出单个代理商能力的复杂任务。这些系统使得解决问题的方法更具动态和分布式的方法，使代理可以互动，共享知识和协调行动以实现共同目标。

在多代理设置中，每个代理都旨在在更广泛的上下文中处理特定的任务或过程。由于代理可以独立运行和并行运作，从而确保更快的任务完成和增强的可扩展性，因此这种劳动力划分会提高效率。

生成AI应用的代理框架 - 分析Vidhya

多代理系统的主要好处

专业：代理可以设计用于专门研究特定领域，例如Web搜索，数据检索或代码执行。每个代理都专注于特定领域，允许对任务进行更精确和准确的处理。
协作：通过共同努力，代理可以在复杂的问题解决中共享信息，一致性并相互支持。一个代理可能会收集数据，而另一个代理可以收集数据，从而创建一个更强大，更灵活的系统。
弹性：如果一个代理失败或遇到问题，其他代理可以介入，以确保仍然可以完成任务。这会创建一个具有内置冗余的更具弹性系统。
可伸缩性：多代理系统是可扩展的，可以随着任务的复杂性增长而更容易添加更多的代理。随着需求的增加，可以引入其他代理以平衡工作量。

多代理系统中的工具使用

矢量数据库，外部API和代码执行等工具在多代理系统中发挥了作用。例如，一个代理可以使用矢量数据库检索相关信息，而另一个代理商可能会使用API获取实时数据。这些工具使代理商能够有效地工作，从而可以处理更复杂和多方面的任务。

两个代理系统 - 反射

在两个代理系统中，这个想法围绕着两个不同的代理人共同努力，每个代理都具有反思和完善任务的独特作用。这种反思性质对于需要迭代过程和动态调整的复杂任务至关重要。

一个代理通常会扮演执行主要任务的角色，例如生成文本，执行代码或检索数据。同时，第二代理人充当反思实体，审查输出，提供反馈和建议改进。这种反思过程对于提高工作的整体质量至关重要，确保第一代理可以从过去的行动中学习并做出更好的决策。

生成AI应用的代理框架 - 分析Vidhya

例如，在代码执行的上下文中，第一个代理可能会基于给定的任务生成代码，而第二代理会审查代码，检查潜在错误或效率低下，并提示修订。这种来回动态可以持续改进和更高质量的结果。

两种代理系统中的反射有助于克服传统AI模型的局限性，在这种情况下通常不存在反馈循环。反射剂确保任务不仅完成，而且可以提高，以提高效率，创造力和准确性。这种协作可以在代码生成，数据检索和解决问题的过程等任务中提高性能。

多代理系统 - 组聊天

在多机构系统中，代理商通过在他们之间分发任务来协作解决复杂的问题。在小组聊天环境中，多个代理商并行运作，交流和共享知识。每个代理都为任务的特定部分做出了贡献。该系统可实现集体解决问题，代理专门在不同领域。结果，任务更快，更有效地完成。

例如，一个代理商可能会处理Web搜索任务，另一个代理可能负责代码执行，而第三个可能专注于与外部API进行交互。这些代理商可以交流并分享他们的发现，从而为更广泛的目标做出了贡献。小组聊天动态使每个代理能够理解总体目标，将其分解为较小的组件，然后聚集在一起提供整体解决方案。

生成AI应用的代理框架 - 分析Vidhya

组聊天设置对于需要各种形式的专业知识或资源的任务很有用。代理人利用彼此的优势和知识基础。持续的沟通确保代理保持最终目标。他们根据其他代理商的见解实时调整策略。这创建了一个合作的生态系统，该生态系统模仿人类团队合作，并具有自动化和可扩展性的增加。

了解代理框架

代理框架是旨在促进AI代理的创建，管理和部署的专业软件平台或软件包。这些框架提供了预先建立的组件和抽象，从而简化了构建代理系统的过程，从而使开发人员可以专注于更高级别的任务，而不是重新发明基础元素。

代理框架的关键特征包括：

预先构建的组件和抽象：这些框架提供了必不可少的构建块，以帮助开发人员快速建立代理和工作流程。他们定义了常见的设计模式和工作流程，以简化AI系统的创建。
与工具和环境集成：代理框架旨在与各种外部工具和环境无缝地工作，使代理能够与数据库，API和复杂任务所需的其他服务进行交互。
代理之间的通信：框架支持多代理通信，使代理可以协作，共享信息并共同处理更大的任务。此功能在协调是关键的多代理系统中尤为重要。
内存管理：有效地处理内存对于代理执行需要随着时间的时间上下文保留的任务至关重要。代理框架提供了管理和访问内存的机制，以确保代理可以在需要时召回相关信息。
监视和调试：这些平台通常包括用于监视代理性能，跟踪工作流程和调试的内置工具，以确保代理按预期运行，并实现更轻松的故障排除。

生成AI应用的代理框架 - 分析Vidhya

另请阅读：2024年建造AI代理的前5个框架

代理框架 - Phidata

Phidata的代理框架使用户能够建立高级的AI助手。它超越了大型语言模型（LLM）。 Phidata集成了内存，知识和一套工具。这增强了AI助手的能力。它使他们更有效地处理复杂的任务。

在Phidata框架中，AI助手是几个关键组成部分的组合：

LLM（大语言模型） ：助手的核心，负责处理自然语言并产生响应。

生成AI应用的代理框架 - 分析Vidhya

内存：这使助手可以随着时间的推移保留信息，使其能够通过回忆过去的互动来维护上下文并改善其响应。
知识来源：其中包括各种数据输入，例如聊天历史记录，PDF，网站和数据库，助手在提供响应时可以参考。
工具：助手配备了强大的工具来执行动作，而不仅仅是回答问题。这些工具包括：
- 网络搜索：实时查找信息。
- 发送电子邮件：允许助手处理通信任务。
- 总结文档：提供从大型文本中凝结信息的能力。
- 运行查询：与数据库进行交互并运行特定查询以检索相关数据。
实体：助手可以使用结构化数据，例如JSON，拨打API呼叫，并使用事实或存储的文本来告知其响应。
工作流和触发器：Phidata助理可以触发工作流程，例如数据库操作或矢量数据库操作（VectordB），以使复杂的过程自动化。

代理框架 - CREWAI

CREWAI框架专门设计，以实现和管理角色扮演的AI代理的创建和管理，这些AI代理人可以作为凝聚力单元一起解决复杂的任务。它提供了一种结构化的方法来构建和部署可以以协调和协作方式运行的AI代理。

生成AI应用的代理框架 - 分析Vidhya

Crewai的主要特征包括

基于角色的AI代理：CREWAI促进了具有特定角色的AI代理的设计，使它们可以在确定的结构中共同工作。这些代理可以根据其能力分配专业任务，从而有效地分配劳动力。
可自定义的工具：用户可以定义每个AI代理将使用的工具，并根据手头任务的要求对其进行自定义。这种灵活性使代理可以利用正确的工具来有效地执行其功能。
任务分配和执行：CREWAI支持定义可以是顺序或分层的任务执行过程的能力，具体取决于工作流的复杂性。这样可以确保任务以正确的顺序或作为较大结构化计划的一部分完成。
输出管理：该框架使代理可以将其输出作为文件保存，从而轻松检索和查看其工作结果。这对于创建文档或任务完成日志特别有用。
开源模型兼容性：Crewai旨在与开源模型合作，为希望将各种AI模型集成到框架中的用户提供了灵活性。这使得更广泛的开发人员和用例都可以使用。

Crewai使AI代理团队可以在无缝，有组织和协作环境中担任专业角色和任务。

代理框架 - 自动源

Autogen是Microsoft开发的开源编程框架，旨在促进AI代理的建设和部署。它提供了一个灵活的平台，该平台使开发人员可以为各种任务和用例定制AI代理。该框架特别适合复杂的多代理工作流程，为对话模式和互动提供了强有力的支持。

Autogen的关键特征包括

可自定义的AI代理：Autogen允许对AI代理进行量身定制以满足各种需求，从而适应各种任务和行业。用户可以根据特定要求修改代理行为，工具和工作流程。
支持复杂的多代理工作流程：该框架支持高级对话模式，使多个代理在复杂的场景中无缝地工作。这些多代理工作流程使其非常适合需要协调多个任务的大规模操作。
人类融合的互动：Autogen将人类的监督整合到了这一过程中，从而允许人类的相互作用。这样可以确保人类操作员可以做出关键决策，从而提高AI系统的可靠性。
代码执行支持：Autogen为代码执行提供了强大的支持，允许AI代理在本地环境或通过Docker容器中执行脚本或程序。这使其适合自动化，数据分析或软件开发等技术任务。
对话记忆和上下文管理：Autogen配备了对话性记忆功能，使AI代理能够记住过去的互动并在长时间的对话中保持上下文。这对于保持对话中的连续性至关重要，尤其是在客户服务或协作环境中。
内置错误处理：框架具有内置的错误处理机制，以确保即使出现意外问题，也可以增强系统的可靠性和弹性。

下图是AI系统的配置，该系统没有人输入（Human_Input_Mode =“ Never”）并自动处理任务。它包括由GroupChatmanager管理的conversableAgent，AssistantAgent和userProxyagent之类的代理，启用了与人类输入选项的组聊天交互（Human_Input_mode =“ wally wally”）。

生成AI应用的代理框架 - 分析Vidhya

多代理AI系统使用助手，专家和指挥官等专业代理来处理从数学解决问题到动态组聊天和多代理编码的各种任务。它促进了AI与人类参与者之间的无缝协作和沟通。

生成AI应用的代理框架 - 分析Vidhya

代理AI的用例

现在让我们讨论代理AI的用例。

自动解决问题和决策

代理AI可以通过使用多种专业剂来自主解决复杂问题。例如，一个代理可以致力于检索相关数据，另一个代理人分析该数据，而第三个代理可以根据发现做出决策。这种方法对于风险评估或项目计划等动态决策方案非常有效。

协作多代理编码

在此用例中，Admit AI使多个代理可以协作编码任务。可以在维护通信的同时，可以为代理分配特定的编码职责，例如检索数据，编写代码段或执行测试。这种多机构方法优化了复杂的编程任务，减少了与手动开发相关的时间和错误。

动态的小组聊天

代理AI支持动态群体聊天，其中多个代理共同努力交流和共享信息。这些聊天可能涉及人类或其他AI系统，从而实现有效的任务协调。无论是在客户支持，协作工作环境还是教育方面，代理商都可以处理各种任务，例如回答查询，主持讨论或组织数据。

象棋等对话游戏

一种特定的用例是对话象棋。在这种情况下，代理AI支持人类和AI播放器。代理商管理游戏逻辑并提供战略建议。他们还处理游戏期间的动作。这为用户创造了丰富而沉浸式的体验。它增强了学习和参与。

使用自定义工具执行复杂的任务

代理AI系统可以在可自定义的工具的帮助下执行任务。例如，代理可以发送电子邮件，运行查询或调用API。这使重复或复杂的工作流程（例如业务运营或软件开发）具有效率和精确度的自动化。

另请阅读：有关使用Autogpt构建AI代理的综合指南

代理AI的未来

代理AI的未来设想的系统将越来越多地利用自主权，利用高级功能，例如多代理协作和增强工具集成。这些AI系统将继续发展，以处理更复杂的任务，改善决策并提供更准确的结果。

我们可以期望代理AI扩展到医疗保健，金融和教育等领域。在医疗保健方面，专业代理可以帮助诊断过程。在金融中，他们可以帮助进行财务分析。在教育中，他们可以提供个性化的学习经验。 AI代理从经验中学习的能力不断增长将塑造未来的发展。他们将为各个行业带来更大的效率和智力。

代理AI的道德考虑

代理AI引入了一些道德挑战，特别是在决策和自治方面。随着代理人承担更多的责任并独立运作，如果他们没有足够的监督，就有意想不到的后果。还会出现对问责制的担忧 - 如果AI代理做出有害的决定，则不清楚谁应承担责任。此外，AI代理在数据或决策中永久存在的潜力仍然是一个关键问题。确保代理如何处理信息对缓解偏见和确保道德AI系统至关重要的透明度和公平性。

代理AI对社会的潜在影响

代理AI通过自动化当前需要人类劳动的许多任务来自动化社会的巨大潜力。这可能会提高效率和生产力，尤其是在客户服务，医疗保健和教育等领域。但是，由于AI系统接管了人类传统上的角色，因此代理AI的广泛部署也引起了人们对工作流离失所的关注。

从积极的一面来看，代理AI可以使个人和组织能够更快，更有效地解决复杂问题，从而导致整个行业的创新。潜在的社会影响将取决于我们如何应对与工作过渡，道德和公平访问AI技术相关的挑战。

结论

代理AI代表了人工智能能力的重大飞跃，使得更加自主，智能的系统能够处理复杂的任务并适应各种环境。随着AI代理商的不断发展，他们将在多个行业中发挥关键作用，从医疗保健到金融，提供效率，创新以及新的解决方案，再到现实世界中的问题。但是，随着这一进步，需要仔细的道德考虑，解决诸如问责制，偏见和社会影响之类的挑战。当我们驾驶代理AI的未来时，将其潜力与负责任的部署保持平衡将是确保其对社会的积极贡献的关键。