在將外部知識連接到大語言模型(LLMS)時,開發人員經常努力地努力整合來自眾多源的數據(其中一些結構化的,其中大部分)非結構化的 - 雖然仍在快速,準確的信息返回。這一挑戰是檢索功能生成(RAG)的核心,它為LLMS提供了一種令人信服的方式,可以按需提取特定於域的數據。但是,隨著數據量表和對精確連接的需求的增長,破布管道可能會變得笨拙。
>
這就是Cognee和Llamaindex介入的地方,它引入了將標準抹布轉換為GraphRag的系統 - 這種方法不僅可以檢索相關的文本,而且還建立了在數據點之間建立更豐富的基於圖形的關係。從本質上講,它超越了基於靜態的,基於塊的檢索,並提供了全球知識的“地圖”,可以為更強大和上下文準確的響應提供動力。學習目標
>本文是> > data Science Blogathon的一部分。 內容表
cognee是一個知識和記憶管理框架,它從人類創建心理圖的方式中汲取靈感。通過將對象,概念和關係作為圖形結構進行建模,它有助於將結構和上下文帶入原始數據,從而使知識更具可通道和可互操作。 LlamainDex通過用作多功能數據集成庫,從各種來源(包括數據庫,API和非結構化文本)中無縫匯集數據來補充這一點。無論您是處理PDF,SQL表還是JSON端點,LlamainDex都可以將這些信息流統一到連貫的管道中。
人類啟發的知識模型
:認知模仿認知功能,在圖表中表示對象和概念,以突出其關係。:讓您精確地對任何垂直或專業用例進行建模。
>您將安裝和配置必要的依賴項 - cognee,llamaindex以及任何選擇的LLM和數據庫提供商。這一初步步驟可確保您的環境擁有管理矢量嵌入,圖形存儲和LLM推理所需的一切。
>!pip install llama-index-graph-rag-cognee==0.1.2 # Import required libraries import os import asyncio import cognee from llama_index.core import Document from llama_index.graph_rag.cognee import CogneeGraphRAG # Set API key for OpenAI if "OPENAI_API_KEY" not in os.environ: os.environ["OPENAI_API_KEY"] = ""
無論您是短文本片段還是整個文檔集,都可以收集數據並將其加載到集合中。 LlamainDex可以處理各種文件格式和數據源,但是您通常會在可管理的段或“文檔”中提供文本。
documents = [ Document( text="Jessica Miller, Experienced Sales Manager with a strong track record in driving sales growth and building high-performing teams." ), Document( text="David Thompson, Creative Graphic Designer with over 8 years of experience in visual design and branding." ), ]步驟3:初始化cognegraphrag
步驟4:添加和處理數據
cogneeRAG = CogneeGraphRAG( llm_api_key=os.environ["OPENAI_API_KEY"], llm_provider="openai", llm_model="gpt-4o-mini", graph_db_provider="networkx", vector_db_provider="lancedb", relational_db_provider="sqlite", relational_db_name="cognee_db", )
步驟5:執行搜索
# Load documents into CogneeGraphRAG await cogneeRAG.add(documents, "test")
基於圖形的
!pip install llama-index-graph-rag-cognee==0.1.2 # Import required libraries import os import asyncio import cognee from llama_index.core import Document from llama_index.graph_rag.cognee import CogneeGraphRAG # Set API key for OpenAI if "OPENAI_API_KEY" not in os.environ: os.environ["OPENAI_API_KEY"] = ""
> cognee和llamaindex將基於圖的推理與靈活的數據集成相結合,將傳統的抹布轉變為一種更具結構化和有見地的方法。這種協同作用增強了知識檢索,改善了上下文理解,並簡化了針對AI驅動的應用程序的部署。
>協同的代理框架和內存增強的查詢和見解
超越文本:可視化知識圖
>
識別模式
:請參閱密切相關概念或實體的群集。
這對您的業務或研究意味著什麼?
您是建造專業聊天機器人的獨奏開發人員還是企業團隊構建知識平台,GraphRag都提供了堅固,靈活的基礎。
>想了解更多或自己嘗試?您可以在Google Colab中運行一個詳細的演示,您將確切地看到如何設置環境,加載數據,構建知識圖並運行查詢。底線:如果您認真考慮以與高級語言模型同時利用數據的全部潛力,那麼Cognee和Llamaindex的GraphRag方法就是下一步。有了幾行配置和一些結構良好的數據,您可以將純文本轉換為可行的智能 - 縮小非結構化文檔和真正的“智能”見解之間的差距。
結論Cognee和Llamaindex通過將結構化知識檢索與先進的索引技術集成在一起,為增強抹布系統提供了強大的組合。這種協同作用改善了各種AI應用程序的上下文理解,檢索效率和適應性。通過利用基於圖的推理和靈活的數據集成,組織可以構建更智能,可擴展和準確的AI解決方案。隨著AI驅動的知識系統的發展,Cognee和LlamainDex等工具將在塑造信息檢索的未來中發揮至關重要的作用。
鑰匙要點cognee和llamaindex通過結構化知識檢索增強了抹布系統。
一致的,可解釋的圖形結構
無縫集成與您選擇的LLM,Vector Store或Database Store或Database
Q3。 LlamainDex在此設置中扮演什麼角色? LlamainDex(以前為GPT指數)是將LLM與不同數據源集成的圖書館。它處理文檔解析,索引和查詢等任務,使您能夠以簡化的方式將非結構化內容(PDFS,網頁,JSON數據等)送入您的LLM。與Cognee配對時,LlamainDex在將數據轉換為基於圖的表示之前有助於構造數據。與傳統的抹布相比,GraphRag如何改善查詢結果?傳統的抹布獨立嵌入了大量文本,如果信息分佈在不同的文檔中,它們可能會失去全球環境。 GraphRag在單個知識圖中連接相關概念,從而使LLM了解更廣泛的關係。結果,該系統可以提供更完整和上下文的答案,尤其是涉及來自多個來源信息的查詢。
以上是Cognee Llamaindex:構建強大的GraphRag管道的詳細內容。更多資訊請關注PHP中文網其他相關文章!