使用DeepSeek R1構建RQA系統並簡化-人工智慧-PHP中文網

首頁

科技週邊

人工智慧

使用DeepSeek R1構建RQA系統並簡化

Christopher Nolan

Mar 07, 2025 am 10:43 AM

> DeepSeek R1：通過基於檢索的問題回答

的AI應用開創性的開源推理模型

DeepSeek R1正在迅速獲得其在構建AI應用方面的效率和準確性的吸引力。本文詳細介紹了使用DeepSeek R1，Langchain和簡化的基於檢索的問答（RQA）系統的構建。我們將在實際推理任務中探索其功能，並在實際應用中展示其功能。

鍵學習成果：

掌握由DeepSeek R1驅動的RQA系統的增強的推理和解決問題的能力。
學會將DeepSeek R1集成到基於檢索的問題解答系統中。
>分析現實世界DeepSeek R1在編碼，數學和邏輯推理中的應用。
（本文是數據科學博客馬拉鬆的一部分。）目錄的
表：

了解DeepSeek R1

> DeepSeek R1-Zero和R1培訓

> DeepSeek R1的四個訓練階段

> DeepSeek R1的關鍵功能

的本地部署
構建RQA系統
>理解DeepSeek R1
在AI的動態領域，開源基礎模型正在改變企業AI的開發。由中國人工智能公司DeepSeek開發的DeepSeek R1是一種開源推理模型，旨在在需要邏輯推理，數學解決問題和實時決策的任務上表現出色。從一般推理到代碼生成的各種應用程序，它的效率和性能延伸。 >
>

>許多大型語言模型（LLMS）遵循三階段的培訓過程（預訓練，監督微調和強化學習），但DeepSeek R1-Zero採用了另一種方法。它利用了預先訓練的DeepSeek-V3基本模型（6710億參數）和跳過監督的微調，直接利用稱為組相對策略優化（GRPO）的大規模增強學習技術。

基於近端策略優化（PPO）的

> DeepSeek R1的四個訓練階段

> DeepSeek R1建立在DeepSeek R1-Zero的基礎之上，並結合了四個關鍵培訓階段：

冷啟動：在DeepSeek R1-Zero數據的高質量子集上進行微調以增強可讀性。
推理強化學習：通過跨編碼，數學，科學和邏輯領域的大規模強化學習來增強推理技能。
拒絕採樣和監督微調：生成多個樣本，僅通過拒絕採樣保留正確且可讀的樣本，然後再通過生成獎勵模型進行進一步的微調。 >
>多樣化的強化學習：利用基於規則的獎勵來完成數學和語言模型反饋以與人類偏好保持一致。

> deepSeek r1的密鑰特徵

>促進檢查，修改和集成到各種項目中。在GitHub和Azure AI Foundry等平台上可用。

高性能：

可與各種基準（數學，代碼生成，複雜推理）上的OpenAI的GPT-4媲專家（MOE）體系結構的混合物

> ： 67.1億個參數模型僅激活每個正向參數370億個參數，優化效率。

蒸餾型：提供較小，更可部署的型號（例如，DeepSeek-R1-Distill-Qwen-32b，Qwen-1.5b，7b，7b，14b）。 >

DeepSeek r1

本地部署

>使用Ollama很簡單：

>安裝Ollama。

在您的終端中運行以下命令（可以選擇模型大小）：>

構建使用DeepSeek R1

ollama run deepseek-r1   # Default 7B model
ollama run deepseek-r1:1.5b # Specific model

的RQA系統 Building a RQA System with DeepSeek R1 and Streamlit 讓我們使用langchain和deepseek r1構建一個RQA系統：

步驟1：導入庫>

（步驟2-10：構建簡易應用程序的其餘步驟，包括文件上傳，嵌入創建，矢量存儲生成，檢索器設置，LLM定義，提示模板創建，QA鏈創建，UI定義和UI實現，與原始響應相同。請參閱原始響應。

輸出示例：

（用示例查詢和響應說明了應用程序的功能。）>

import streamlit as st
from langchain_community.document_loaders.csv_loader import CSVLoader
from langchain_community.embeddings import HuggingFaceEmbeddings
from langchain_community.vectorstores import FAISS
from langchain_community.llms import Ollama
from langchain.prompts import PromptTemplate
from langchain.chains import LLMChain
from langchain.chains.combine_documents.stuff import create_stuff_documents_chain
from langchain.chains import RetrievalQA

結論

DeepSeek R1代表了AI推理模型的重大進步。它的複雜技術和開源可訪問性的結合使其成為開發人員的強大工具。 RQA系統示例展示了其實際應用和未來創新的潛力。

鑰匙要點：

MOE體系結構優化了資源利用率。

參考：

> grpo

>常見問題：

（常見問題解答部分與原始響應保持相同。）

以上是使用DeepSeek R1構建RQA系統並簡化的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

特斯拉的Robovan是2024年的Robotaxi預告片中的隱藏寶石Apr 22, 2025 am 11:48 AM

自2008年以來，我一直倡導這輛共享乘車麵包車，即後來被稱為“ Robotjitney”，後來是“ Vansit”，這是城市運輸的未來。我預見這些車輛是21世紀的下一代過境解決方案Surpas

Sam俱樂部在AI上押注以消除收據檢查並增強零售Apr 22, 2025 am 11:29 AM

革新結帳體驗 Sam's Club的創新性“ Just Go”系統建立在其現有的AI驅動“掃描和GO”技術的基礎上，使會員可以在購物旅行期間通過Sam's Club應用程序進行掃描。

Nvidia的AI Omniverse在GTC 2025擴展Apr 22, 2025 am 11:28 AM

NVIDIA在GTC 2025上的增強可預測性和新產品陣容 NVIDIA是AI基礎架構的關鍵參與者，正在專注於提高其客戶的可預測性。這涉及一致的產品交付，達到績效期望以及

探索Google的功能Apr 22, 2025 am 11:26 AM

Google的Gemma 2：強大，高效的語言模型 Google的Gemma語言模型家族以效率和性能而慶祝，隨著Gemma 2的到來而擴展。此最新版本包括兩種模型：270億個參數VER

下一波《 Genai：與Kirk Borne博士的觀點》 -Analytics VidhyaApr 22, 2025 am 11:21 AM

這一領先的數據劇集以數據科學家，天體物理學家和TEDX演講者Kirk Borne博士為特色。 Borne博士是大數據，AI和機器學習的著名專家，為當前狀態和未來的Traje提供了寶貴的見解

AI適合跑步者和運動員：我們取得了出色的進步Apr 22, 2025 am 11:12 AM

這次演講中出現了一些非常有見地的觀點——關於工程學的背景信息，這些信息向我們展示了為什麼人工智能如此擅長支持人們的體育鍛煉。我將從每位貢獻者的觀點中概括出一個核心思想，以展示三個設計方面，這些方面是我們探索人工智能在體育運動中應用的重要組成部分。邊緣設備和原始個人數據關於人工智能的這個想法實際上包含兩個組成部分——一個與我們放置大型語言模型的位置有關，另一個與我們人類語言和我們的生命體徵在實時測量時“表達”的語言之間的差異有關。 Alexander Amini 對跑步和網球都很了解，但他還