搜索
首页科技周边人工智能掌握商业人工智能:使用 RAG 和 CRAG 构建企业级人工智能平台

浏览我们的指南,掌握如何让您的企业充分利用人工智能技术。了解 RAG 和 CRAG 集成、矢量嵌入、LLM 和提示工程等内容,这对那些希望负责任地应用人工智能的企业来说非常有益。

为企业打造AI-Ready平台

企业引入生成式人工智能时,会遇到许多需要战略管理的业务风险。这些风险通常是相互关联的,范围从导致合规问题的潜在偏见到缺乏领域知识。主要问题包括声誉损害、遵守法律和监管标准(尤其是与客户互动有关)、知识产权侵权、道德问题和隐私问题(尤其是在处理个人或可识别数据时)。

为了应对这些挑战,提议采用检索增强生成(RAG)等混合策略。RAG技术能够提高人工智能生成内容的质量,使企业人工智能计划更为安全可靠。这一策略能够有效解决知识缺失和错误信息等问题,同时也确保遵守法律和道德准则,防止声誉受损和违规行为的发生。

掌握商业人工智能:使用 RAG 和 CRAG 构建企业级人工智能平台

了解检索增强生成 (RAG)

检索增强生成(RAG)是一种先进方法,通过集成企业知识库中的信息来提高人工智能内容创建的准确性和可靠性。将 RAG 视为一位大厨,他依靠与生俱来的天赋、全面的培训和创意天赋,所有这些都得到了对烹饪基础知识的透彻理解的支持。当需要使用不寻常的香料或满足对新颖菜肴的要求时,厨师会查阅可靠的烹饪参考资料,以确保成分得到最佳利用。

就像一名大厨可以烹饪出多样的美食一样,GPT和LLaMA-2等人工智能系统也能生成各种主题的内容。然而,当需要提供详细准确的信息时,尤其是在处理新颖的美食或浏览大量企业数据时,它们会借助特殊工具来确保信息的准确性和深度。

掌握商业人工智能:使用 RAG 和 CRAG 构建企业级人工智能平台

如果 RAG 的检索阶段不充分怎么办?

CRAG是一种纠正性干预,旨在加强RAG设置的稳定性。CRAG利用T5来评估检索到的文档的相关性。当企业来源的文档被视为不相关时,可能会通过网络搜索来填补信息空白。

企业级生成人工智能解决方案的架构注意事项

架构从根本上是围绕三个核心支柱构建的:数据摄入、查询和智能检索、生成提示工程和大语言模型

掌握商业人工智能:使用 RAG 和 CRAG 构建企业级人工智能平台

数据第一步是将公司文档的内容转换为易于查询的格式。此转换是使用嵌入模型完成的,遵循以下操作序列

  1. 数据分段:来自企业知识源(例如 Confluence、Jira 和 PDF)的各种文档被提取到系统中。此步骤涉及将文档分解为可管理的部分,通常称为“块”。
  2. 嵌入模型:然后将这些文档块传递给嵌入模型。嵌入模型是一种神经网络,它将文本转换为表示文本语义的数字形式(向量),使其能够被机器理解。
  3. 索引块:然后对嵌入模型产生的向量进行索引。索引是以有利于高效检索的方式组织数据的过程。
  4. 矢量数据库:将所有矢量嵌入保存在矢量数据库中。并将每个嵌入表示的文本保存在不同的文件中,确保包含对相应嵌入的引用。

掌握商业人工智能:使用 RAG 和 CRAG 构建企业级人工智能平台

查询和智能检索:推理服务器收到用户的问题后,就会通过嵌入过程将其转换为向量,该过程使用相同的模型在知识库中嵌入文档。然后,向量数据库进行搜索,以识别与用户意图密切相关的向量,并将其提供给大型语言模型 (LLM) 以丰富上下文。

5.查询:从应用程序和API层进行查询。该查询是用户或其他应用程序在搜索信息时输入的内容。

6.嵌入查询检索:利用生成的 Vector.Embedding 在矢量数据库的索引中开始搜索。选择您想要从矢量数据库中检索的矢量数量;这个数字将与您计划编译和用于解决问题的上下文数量成正比。

7.向量(相似向量):该过程识别相似向量,这些向量表示与查询上下文相关的文档块

8.检索相关向量:
从向量数据库中检索相关向量。例如,在厨师的背景下,它可能相当于两个相关向量:食谱和准备步骤。相应的片段将被收集并随提示一起提供。

9.检索相关块:系统获取与被识别为与查询相关的向量相匹配的文档部分。一旦评估了信息的相关性,系统就会确定后续步骤。如果信息完全一致,它会根据重要性进行排列。如果信息不正确,系统会将其丢弃并在线查找更好的信息。

掌握商业人工智能:使用 RAG 和 CRAG 构建企业级人工智能平台

生成提示工程和LLMs生成提示工程对于指导大型语言模型给出正确答案至关重要。它涉及创建考虑到任何数据差距的清晰而精确的问题。这个过程是持续进行的,需要定期调整以获得更好的响应。确保这些问题合乎道德、没有偏见并避免敏感话题也很重要。

10. 提示工程:然后将检索到的块与原始查询一起使用以创建提示。该提示旨在有效地将查询上下文传达给语言模型。

11. LLM(大型语言模型):工程提示由大型语言模型处理。这些模型可以根据收到的输入生成类似人类的文本。

12. 答案:最后,语言模型使用提示提供的上下文和检索到的块来生成查询的答案。然后,该答案通过应用程序和 API 层发送回用户。

结论

本博客探讨了将人工智能集成到软件开发中的复杂过程,强调了受 CRAG 启发建立企业生成人工智能平台的变革潜力。通过解决即时工程、数据管理和创新检索增强生成 (RAG) 方法的复杂性,我们概述了将人工智能技术纳入业务运营核心的方法。未来的讨论将进一步深入探讨智能开发的生成式人工智能框架,研究最大限度地利用人工智能的具体工具、技术和策略,确保更智能、更高效的开发环境。

来源 | https://www.php.cn/link/1f3e9145ab192941f32098750221c602

作者 | Venkat Rangasamy

以上是掌握商业人工智能:使用 RAG 和 CRAG 构建企业级人工智能平台的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文转载于:51CTO.COM。如有侵权,请联系admin@php.cn删除
什么是Alteryx? |分析Vidhya什么是Alteryx? |分析VidhyaApr 15, 2025 am 11:03 AM

Alteryx:您的多合一数据分析解决方案 想象一下,仅使用统计数据作为线索来解决一个复杂的谜团。 数据专业人士每天面临类似的挑战。 Alteryx是解决方案,使用户能够征服数据复杂性。

Llama 3.1 vs Llama 3:哪个更好?Llama 3.1 vs Llama 3:哪个更好?Apr 15, 2025 am 10:53 AM

Meta的Llama 3.1 70b和Llama 3 70b:详细的比较 Meta最近发布了Llama 3.1,包括70B参数模型,以及较大和较小的变体。 此次升级是在三个月前的Llama 3发布之后发布的。而骆驼3.1

您可以免费开始的7个AI PPT制造商!您可以免费开始的7个AI PPT制造商!Apr 15, 2025 am 10:51 AM

释放您的演示文稿能力:7个免费的AI驱动PowerPoint Maker 无论您是制作杰出的顶峰项目的最后一年学生还是忙碌的专业杂耍会议和演讲,给人留下深刻的印象都是至关重要的。

什么是Power BI语义模型?什么是Power BI语义模型?Apr 15, 2025 am 10:46 AM

介绍 想象一个场景:您的团队被来自不同来源的大量数据集所淹没。 整合,分类和分析此信息以进行有意义的演示是一个挑战。这是Power BI语义模型(PBISM)EX

如何使用Llama索引和Monsterapi建立AI代理如何使用Llama索引和Monsterapi建立AI代理Apr 15, 2025 am 10:44 AM

AI特工:由Llamaindex和Monsterapi提供支持的AI的未来 AI代理有望彻底改变我们与技术的互动方式。 这些自主系统模仿人类行为,执行需要推理,决策和REA的任务

在没有人类干预的情况下训练LLM的7种方法在没有人类干预的情况下训练LLM的7种方法Apr 15, 2025 am 10:38 AM

解锁自治AI:自我训练LLMS的7种方法 想象一个未来AI系统在没有人类干预的情况下学习和发展的未来,就像孩子独立掌握复杂概念的孩子一样。这不是科幻小说;这是自我的应许

通过AI和NLG进行财务报告 - 分析Vidhya通过AI和NLG进行财务报告 - 分析VidhyaApr 15, 2025 am 10:35 AM

AI驱动的财务报告:通过自然语言产生革新见解 在当今动态的业务环境中,准确及时的财务分析对于战略决策至关重要。 传统财务报告

这款Google DeepMind机器人会在2028年奥运会上演奏吗?这款Google DeepMind机器人会在2028年奥运会上演奏吗?Apr 15, 2025 am 10:16 AM

Google DeepMind的乒乓球机器人:体育和机器人技术的新时代 巴黎2024年奥运会可能已经结束,但是由于Google DeepMind,运动和机器人技术的新时代正在兴起。 他们的开创性研究(“实现人类水平的竞争

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
4 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳图形设置
4 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您听不到任何人,如何修复音频
4 周前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解锁Myrise中的所有内容
1 个月前By尊渡假赌尊渡假赌尊渡假赌

热工具

VSCode Windows 64位 下载

VSCode Windows 64位 下载

微软推出的免费、功能强大的一款IDE编辑器

EditPlus 中文破解版

EditPlus 中文破解版

体积小,语法高亮,不支持代码提示功能

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一个PHP/MySQL的Web应用程序,非常容易受到攻击。它的主要目标是成为安全专业人员在合法环境中测试自己的技能和工具的辅助工具,帮助Web开发人员更好地理解保护Web应用程序的过程,并帮助教师/学生在课堂环境中教授/学习Web应用程序安全。DVWA的目标是通过简单直接的界面练习一些最常见的Web漏洞,难度各不相同。请注意,该软件中