搜索
首页科技周边人工智能掌握商业人工智能:使用 RAG 和 CRAG 构建企业级人工智能平台

浏览我们的指南,掌握如何让您的企业充分利用人工智能技术。了解 RAG 和 CRAG 集成、矢量嵌入、LLM 和提示工程等内容,这对那些希望负责任地应用人工智能的企业来说非常有益。

为企业打造AI-Ready平台

企业引入生成式人工智能时,会遇到许多需要战略管理的业务风险。这些风险通常是相互关联的,范围从导致合规问题的潜在偏见到缺乏领域知识。主要问题包括声誉损害、遵守法律和监管标准(尤其是与客户互动有关)、知识产权侵权、道德问题和隐私问题(尤其是在处理个人或可识别数据时)。

为了应对这些挑战,提议采用检索增强生成(RAG)等混合策略。RAG技术能够提高人工智能生成内容的质量,使企业人工智能计划更为安全可靠。这一策略能够有效解决知识缺失和错误信息等问题,同时也确保遵守法律和道德准则,防止声誉受损和违规行为的发生。

掌握商业人工智能:使用 RAG 和 CRAG 构建企业级人工智能平台

了解检索增强生成 (RAG)

检索增强生成(RAG)是一种先进方法,通过集成企业知识库中的信息来提高人工智能内容创建的准确性和可靠性。将 RAG 视为一位大厨,他依靠与生俱来的天赋、全面的培训和创意天赋,所有这些都得到了对烹饪基础知识的透彻理解的支持。当需要使用不寻常的香料或满足对新颖菜肴的要求时,厨师会查阅可靠的烹饪参考资料,以确保成分得到最佳利用。

就像一名大厨可以烹饪出多样的美食一样,GPT和LLaMA-2等人工智能系统也能生成各种主题的内容。然而,当需要提供详细准确的信息时,尤其是在处理新颖的美食或浏览大量企业数据时,它们会借助特殊工具来确保信息的准确性和深度。

掌握商业人工智能:使用 RAG 和 CRAG 构建企业级人工智能平台

如果 RAG 的检索阶段不充分怎么办?

CRAG是一种纠正性干预,旨在加强RAG设置的稳定性。CRAG利用T5来评估检索到的文档的相关性。当企业来源的文档被视为不相关时,可能会通过网络搜索来填补信息空白。

企业级生成人工智能解决方案的架构注意事项

架构从根本上是围绕三个核心支柱构建的:数据摄入、查询和智能检索、生成提示工程和大语言模型

掌握商业人工智能:使用 RAG 和 CRAG 构建企业级人工智能平台

数据第一步是将公司文档的内容转换为易于查询的格式。此转换是使用嵌入模型完成的,遵循以下操作序列

  1. 数据分段:来自企业知识源(例如 Confluence、Jira 和 PDF)的各种文档被提取到系统中。此步骤涉及将文档分解为可管理的部分,通常称为“块”。
  2. 嵌入模型:然后将这些文档块传递给嵌入模型。嵌入模型是一种神经网络,它将文本转换为表示文本语义的数字形式(向量),使其能够被机器理解。
  3. 索引块:然后对嵌入模型产生的向量进行索引。索引是以有利于高效检索的方式组织数据的过程。
  4. 矢量数据库:将所有矢量嵌入保存在矢量数据库中。并将每个嵌入表示的文本保存在不同的文件中,确保包含对相应嵌入的引用。

掌握商业人工智能:使用 RAG 和 CRAG 构建企业级人工智能平台

查询和智能检索:推理服务器收到用户的问题后,就会通过嵌入过程将其转换为向量,该过程使用相同的模型在知识库中嵌入文档。然后,向量数据库进行搜索,以识别与用户意图密切相关的向量,并将其提供给大型语言模型 (LLM) 以丰富上下文。

5.查询:从应用程序和API层进行查询。该查询是用户或其他应用程序在搜索信息时输入的内容。

6.嵌入查询检索:利用生成的 Vector.Embedding 在矢量数据库的索引中开始搜索。选择您想要从矢量数据库中检索的矢量数量;这个数字将与您计划编译和用于解决问题的上下文数量成正比。

7.向量(相似向量):该过程识别相似向量,这些向量表示与查询上下文相关的文档块

8.检索相关向量:
从向量数据库中检索相关向量。例如,在厨师的背景下,它可能相当于两个相关向量:食谱和准备步骤。相应的片段将被收集并随提示一起提供。

9.检索相关块:系统获取与被识别为与查询相关的向量相匹配的文档部分。一旦评估了信息的相关性,系统就会确定后续步骤。如果信息完全一致,它会根据重要性进行排列。如果信息不正确,系统会将其丢弃并在线查找更好的信息。

掌握商业人工智能:使用 RAG 和 CRAG 构建企业级人工智能平台

生成提示工程和LLMs生成提示工程对于指导大型语言模型给出正确答案至关重要。它涉及创建考虑到任何数据差距的清晰而精确的问题。这个过程是持续进行的,需要定期调整以获得更好的响应。确保这些问题合乎道德、没有偏见并避免敏感话题也很重要。

10. 提示工程:然后将检索到的块与原始查询一起使用以创建提示。该提示旨在有效地将查询上下文传达给语言模型。

11. LLM(大型语言模型):工程提示由大型语言模型处理。这些模型可以根据收到的输入生成类似人类的文本。

12. 答案:最后,语言模型使用提示提供的上下文和检索到的块来生成查询的答案。然后,该答案通过应用程序和 API 层发送回用户。

结论

本博客探讨了将人工智能集成到软件开发中的复杂过程,强调了受 CRAG 启发建立企业生成人工智能平台的变革潜力。通过解决即时工程、数据管理和创新检索增强生成 (RAG) 方法的复杂性,我们概述了将人工智能技术纳入业务运营核心的方法。未来的讨论将进一步深入探讨智能开发的生成式人工智能框架,研究最大限度地利用人工智能的具体工具、技术和策略,确保更智能、更高效的开发环境。

来源 | https://www.php.cn/link/1f3e9145ab192941f32098750221c602

作者 | Venkat Rangasamy

以上是掌握商业人工智能:使用 RAG 和 CRAG 构建企业级人工智能平台的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文转载于:51CTO.COM。如有侵权,请联系admin@php.cn删除
AI内部部署的隐藏危险:治理差距和灾难性风险AI内部部署的隐藏危险:治理差距和灾难性风险Apr 28, 2025 am 11:12 AM

Apollo Research的一份新报告显示,先进的AI系统的不受检查的内部部署构成了重大风险。 在大型人工智能公司中缺乏监督,普遍存在,允许潜在的灾难性结果

构建AI测谎仪构建AI测谎仪Apr 28, 2025 am 11:11 AM

传统测谎仪已经过时了。依靠腕带连接的指针,打印出受试者生命体征和身体反应的测谎仪,在识破谎言方面并不精确。这就是为什么测谎结果通常不被法庭采纳的原因,尽管它曾导致许多无辜者入狱。 相比之下,人工智能是一个强大的数据引擎,其工作原理是全方位观察。这意味着科学家可以通过多种途径将人工智能应用于寻求真相的应用中。 一种方法是像测谎仪一样分析被审问者的生命体征反应,但采用更详细、更精确的比较分析。 另一种方法是利用语言标记来分析人们实际所说的话,并运用逻辑和推理。 俗话说,一个谎言会滋生另一个谎言,最终

AI是否已清除航空航天行业的起飞?AI是否已清除航空航天行业的起飞?Apr 28, 2025 am 11:10 AM

航空航天业是创新的先驱,它利用AI应对其最复杂的挑战。 现代航空的越来越复杂性需要AI的自动化和实时智能功能,以提高安全性,降低操作

观看北京的春季机器人比赛观看北京的春季机器人比赛Apr 28, 2025 am 11:09 AM

机器人技术的飞速发展为我们带来了一个引人入胜的案例研究。 来自Noetix的N2机器人重达40多磅,身高3英尺,据说可以后空翻。Unitree公司推出的G1机器人重量约为N2的两倍,身高约4英尺。比赛中还有许多体型更小的类人机器人参赛,甚至还有一款由风扇驱动前进的机器人。 数据解读 这场半程马拉松吸引了超过12,000名观众,但只有21台类人机器人参赛。尽管政府指出参赛机器人赛前进行了“强化训练”,但并非所有机器人均完成了全程比赛。 冠军——由北京类人机器人创新中心研发的Tiangong Ult

镜子陷阱:人工智能伦理和人类想象力的崩溃镜子陷阱:人工智能伦理和人类想象力的崩溃Apr 28, 2025 am 11:08 AM

人工智能以目前的形式并不是真正智能的。它擅长模仿和完善现有数据。 我们不是在创造人工智能,而是人工推断 - 处理信息的机器,而人类则

新的Google泄漏揭示了方便的Google照片功能更新新的Google泄漏揭示了方便的Google照片功能更新Apr 28, 2025 am 11:07 AM

一份报告发现,在谷歌相册Android版7.26版本的代码中隐藏了一个更新的界面,每次查看照片时,都会在屏幕底部显示一行新检测到的面孔缩略图。 新的面部缩略图缺少姓名标签,所以我怀疑您需要单独点击它们才能查看有关每个检测到的人员的更多信息。就目前而言,此功能除了谷歌相册已在您的图像中找到这些人之外,不提供任何其他信息。 此功能尚未上线,因此我们不知道谷歌将如何准确地使用它。谷歌可以使用缩略图来加快查找所选人员的更多照片的速度,或者可能用于其他目的,例如选择要编辑的个人。我们拭目以待。 就目前而言

加固芬特的指南 - 分析Vidhya加固芬特的指南 - 分析VidhyaApr 28, 2025 am 09:30 AM

增强者通过教授模型根据人类反馈进行调整来震撼AI的开发。它将监督的学习基金会与基于奖励的更新融合在一起,使其更安全,更准确,真正地帮助

让我们跳舞:结构化运动以微调我们的人类神经网让我们跳舞:结构化运动以微调我们的人类神经网Apr 27, 2025 am 11:09 AM

科学家已经广泛研究了人类和更简单的神经网络(如秀丽隐杆线虫中的神经网络),以了解其功能。 但是,出现了一个关键问题:我们如何使自己的神经网络与新颖的AI一起有效地工作

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

mPDF

mPDF

mPDF是一个PHP库,可以从UTF-8编码的HTML生成PDF文件。原作者Ian Back编写mPDF以从他的网站上“即时”输出PDF文件,并处理不同的语言。与原始脚本如HTML2FPDF相比,它的速度较慢,并且在使用Unicode字体时生成的文件较大,但支持CSS样式等,并进行了大量增强。支持几乎所有语言,包括RTL(阿拉伯语和希伯来语)和CJK(中日韩)。支持嵌套的块级元素(如P、DIV),

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一个PHP/MySQL的Web应用程序,非常容易受到攻击。它的主要目标是成为安全专业人员在合法环境中测试自己的技能和工具的辅助工具,帮助Web开发人员更好地理解保护Web应用程序的过程,并帮助教师/学生在课堂环境中教授/学习Web应用程序安全。DVWA的目标是通过简单直接的界面练习一些最常见的Web漏洞,难度各不相同。请注意,该软件中

适用于 Eclipse 的 SAP NetWeaver 服务器适配器

适用于 Eclipse 的 SAP NetWeaver 服务器适配器

将Eclipse与SAP NetWeaver应用服务器集成。

VSCode Windows 64位 下载

VSCode Windows 64位 下载

微软推出的免费、功能强大的一款IDE编辑器