>我已經閱讀了很多有關RAG和AI代理商的信息,但是隨著DeepSeek V3和DeepSeek R1等新模型的發布,似乎建立有效的抹布系統的可能性已大大提高,提供了更好的檢索準確性,增強的推理能力,以及對現實世界應用程序的更可擴展的架構。更複雜的檢索機制,增強的微調選項和多模式功能的整合正在改變AI代理與數據相互作用的方式。它提出了有關傳統抹布方法是否仍然是前進的最佳方法,或者較新的體系結構是否可以提供更有效且上下文意識到的解決方案的問題。
>檢索效果生成(RAG)系統通過結合基於檢索的基於檢索和生成的方法來產生更準確和上下文感知的響應,從而徹底改變了AI模型與數據相互作用的方式。隨著> DeepSeek R1的出現,這是一種以其效率和成本效益而聞名的開源模型,建立有效的抹布系統變得更加易於訪問和實用。在本文中,我們將使用DeepSeek R1構建一個抹布系統。
>目錄的表什麼是deepseek r1?
deepSeek r1是一種開源的AI模型,其目的是提供高質量的推理和檢索功能,以諸如Openai產品(例如OpenAI的產品)成本的一小部分。它具有MIT許可證,使其在商業上可行,適合廣泛的應用程序。另外,這個強大的模型可讓您看到嬰兒床,但是OpenAI O1和O1-Mini不會顯示任何理由令牌。
>將DeepSeek R1用於抹布系統的好處 >使用DeepSeek-R1構建檢索功能的一代(RAG)系統提供了幾個顯著優勢:
1。先進的推理能力:DeepSeek-R1通過在得出結論之前逐步分析和處理信息來模擬類似人類的推理。這種方法增強了系統處理複雜查詢的能力,尤其是在需要邏輯推理,數學推理和編碼任務的領域。
2。開源可訪問性:根據MIT許可證發布,DeepSeek-R1是完全開源的,使開發人員無限制地訪問其模型。這種開放性促進了自定義,微調和集成到各種應用程序中,而沒有通常與專有模型相關的限制。3。競爭性能:基準測試表明,DeepSeek-R1在涉及推理,數學和編碼的任務中,諸如OpenAI的O1之類的領先模型(例如OpenAI的O1)上的領先模型。這種級別的性能確保了用DeepSeek-R1構建的抹布系統可以在各種和具有挑戰性的查詢中提供高質量,準確的響應。
4。思維過程中的透明度:
將DeepSeek-R1整合到抹布系統中,提供了高級推理能力,透明度,性能和成本效率的有效組合,使其成為旨在增強其AI功能的開發人員和組織的令人信服的選擇。 >使用DeepSeek R1 構建抹布系統的步驟
腳本是一個檢索型的一代(抹布)管道:
。
3。設置環境變量 腳本
將API鍵,可以提高安全性。 4。初始化OpenAI嵌入 腳本初始化了一個名為“ text-embedding-3-small”的OpenAI嵌入模型。該模型將文本轉換為向量嵌入
,這是文本含義的高維數字表示。這些嵌入後來用於比較和檢索類似的內容5。加載並拆分PDF文檔 > pdf文件(Agenicai.pdf)已加載並分成頁面>。提取每個頁面文本,允許
較小,更易於管理的文本塊6。創建並存儲矢量數據庫 從PDF中提取的文本轉換為vector嵌入
。8。查詢類似文檔 使用了兩個測試查詢:
langchain's檢索模塊用於:
>獲取相關內容 使用提示模板
>格式化結構化響應這是代碼:
輸入打開AI API鍵
>設置環境變量
創建一個向量db並持續在磁盤上
curl -fsSL https://ollama.com/install.sh | sh與閾值檢索相似性
ollama pull deepseek-r1:1.5b
ollama pull deepseek-r1:1.5b pulling manifest pulling aabd4debf0c8... 100% ▕████████████████▏ 1.1 GB pulling 369ca498f347... 100% ▕████████████████▏ 387 B pulling 6e4c38e1172f... 100% ▕████████████████▏ 1.1 KB pulling f4d24e9138dd... 100% ▕████████████████▏ 148 B pulling a85fe2a2e58e... 100% ▕████████████████▏ 487 B verifying sha256 digest writing manifest success
!pip install langchain==0.3.11 !pip install langchain-openai==0.2.12 !pip install langchain-community==0.3.11 !pip install langchain-chroma==0.1.4
from getpass import getpass OPENAI_KEY = getpass('Enter Open AI API Key: ')
import os os.environ['OPENAI_API_KEY'] = OPENAI_KEY
from langchain_openai import OpenAIEmbeddings openai_embed_model = OpenAIEmbeddings(model='text-embedding-3-small')
from langchain_community.document_loaders import PyPDFLoader loader = PyPDFLoader('AgenticAI.pdf') pages = loader.load_and_split() texts = [doc.page_content for doc in pages] from langchain_chroma import Chroma chroma_db = Chroma.from_texts( texts=texts, collection_name='db_docs', collection_metadata={"hnsw:space": "cosine"}, # Set distance function to cosine embedding=openai_embed_model )
>查看我們有關DeepSeek工作和與類似模型進行比較的詳細文章:
similarity_threshold_retriever = chroma_db.as_retriever(search_type="similarity_score_threshold",search_kwargs={"k": 3,"score_threshold": 0.3}) query = "what is the old capital of India?" top3_docs = similarity_threshold_retriever.invoke(query) top3_docs>使用DeepSeek-V3
[]
query = "What is Agentic AI?" top3_docs = similarity_threshold_retriever.invoke(query) top3_docs>
如何訪問DeepSeek Janus Pro 7b?
結論
>是否想使用DeepSeek構建應用程序?立即簽約我們免費的DeepSeek課程!
以上是如何使用DeepSeek R1構建抹布系統?的詳細內容。更多資訊請關注PHP中文網其他相關文章!