搜尋
首頁科技週邊人工智慧使用DeepSeek R1構建RQA系統並簡化

> DeepSeek R1:通過基於檢索的問題回答

的AI應用 開創性的開源推理模型

DeepSeek R1正在迅速獲得其在構建AI應用方面的效率和準確性的吸引力。 本文詳細介紹了使用DeepSeek R1,Langchain和簡化的基於檢索的問答(RQA)系統的構建。 我們將在實際推理任務中探索其功能,並在實際應用中展示其功能。

鍵學習成果:

  • 掌握由DeepSeek R1驅動的RQA系統的增強的推理和解決問題的能力。
  • >了解AI驅動的問答的DeepSeek R1的架構和功能。
  • 學會將DeepSeek R1集成到基於檢索的問題解答系統中。
  • 請參閱增強學習如何提高DeepSeek R1響應的準確性。
  • >分析現實世界DeepSeek R1在編碼,數學和邏輯推理中的應用。
  • (本文是數據科學博客馬拉鬆的一部分。) 目錄的
  • 表:

了解DeepSeek R1

> DeepSeek R1-Zero和R1培訓

> DeepSeek R1的四個訓練階段

> DeepSeek R1的關鍵功能
    DeepSeek R1
  • 的本地部署
  • >用DeepSeek R1
  • 構建RQA系統
  • 常見問題
  • >理解DeepSeek R1
  • 在AI的動態領域,開源基礎模型正在改變企業AI的開發。 由中國人工智能公司DeepSeek開發的DeepSeek R1是一種開源推理模型,旨在在需要邏輯推理,數學解決問題和實時決策的任務上表現出色。 從一般推理到代碼生成的各種應用程序,它的效率和性能延伸。 >
  • deepSeek r1-Zero和R1訓練
  • >
>許多大型語言模型(LLMS)遵循三階段的培訓過程(預訓練,監督微調和強化學習),但DeepSeek R1-Zero採用了另一種方法。 它利用了預先訓練的DeepSeek-V3基本模型(6710億參數)和跳過監督的微調,直接利用稱為組相對策略優化(GRPO)的大規模增強學習技術。

基於近端策略優化(PPO)的

> DeepSeek R1的四個訓練階段

> DeepSeek R1建立在DeepSeek R1-Zero的基礎之上,並結合了四個關鍵培訓階段:

  1. 冷啟動:在DeepSeek R1-Zero數據的高質量子集上進行微調以增強可讀性。
  2. 推理強化學習:通過跨編碼,數學,科學和邏輯領域的大規模強化學習來增強推理技能。
  3. 拒絕採樣和監督微調:生成多個樣本,僅通過拒絕採樣保留正確且可讀的樣本,然後再通過生成獎勵模型進行進一步的微調。 >
  4. >多樣化的強化學習:利用基於規則的獎勵來完成數學和語言模型反饋以與人類偏好保持一致。
  5. >
> deepSeek r1的密鑰特徵

>

    >開源(MIT許可證):>促進檢查,修改和集成到各種項目中。 在GitHub和Azure AI Foundry等平台上可用。
  • 高性能:
  • 可與各種基準(數學,代碼生成,複雜推理)上的OpenAI的GPT-4媲 專家(MOE)體系結構的混合物
  • > 67.1億個參數模型僅激活每個正向參數370億個參數,優化效率。
  • 蒸餾型:提供較小,更可部署的型號(例如,DeepSeek-R1-Distill-Qwen-32b,Qwen-1.5b,7b,7b,14b)。 >
  • DeepSeek r1
  • >
  • 本地部署
>使用Ollama很簡單:

>安裝Ollama。

在您的終端中運行以下命令(可以選擇模型大小):>

  1. >
構建使用DeepSeek R1
ollama run deepseek-r1   # Default 7B model
ollama run deepseek-r1:1.5b # Specific model

的RQA系統 Building a RQA System with DeepSeek R1 and Streamlit讓我們使用langchain和deepseek r1構建一個RQA系統:

>

步驟1:導入庫>

(步驟2-10:構建簡易應用程序的其餘步驟,包括文件上傳,嵌入創建,矢量存儲生成,檢索器設置,LLM定義,提示模板創建,QA鏈創建,UI定義和UI實現,與原始響應相同。請參閱原始響應。

>

輸出示例:

(用示例查詢和響應說明了應用程序的功能。)>

import streamlit as st
from langchain_community.document_loaders.csv_loader import CSVLoader
from langchain_community.embeddings import HuggingFaceEmbeddings
from langchain_community.vectorstores import FAISS
from langchain_community.llms import Ollama
from langchain.prompts import PromptTemplate
from langchain.chains import LLMChain
from langchain.chains.combine_documents.stuff import create_stuff_documents_chain
from langchain.chains import RetrievalQA

結論

DeepSeek R1代表了AI推理模型的重大進步。它的複雜技術和開源可訪問性的結合使其成為開發人員的強大工具。 RQA系統示例展示了其實際應用和未來創新的潛力。

鑰匙要點:

    DeepSeek R1是一種高性能的開源推理模型。
  • RQA系統利用DeepSeek R1的功能來回答。
  • > DeepSeek R1的訓練增強了解釋性和準確性。
  • MOE體系結構優化了資源利用率。
參考:

> grpo

    > ai論文學院
  • >常見問題:

(常見問題解答部分與原始響應保持相同。)

以上是使用DeepSeek R1構建RQA系統並簡化的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
特斯拉的Robovan是2024年的Robotaxi預告片中的隱藏寶石特斯拉的Robovan是2024年的Robotaxi預告片中的隱藏寶石Apr 22, 2025 am 11:48 AM

自2008年以來,我一直倡導這輛共享乘車麵包車,即後來被稱為“ Robotjitney”,後來是“ Vansit”,這是城市運輸的未來。 我預見這些車輛是21世紀的下一代過境解決方案Surpas

Sam俱樂部在AI上押注以消除收據檢查並增強零售Sam俱樂部在AI上押注以消除收據檢查並增強零售Apr 22, 2025 am 11:29 AM

革新結帳體驗 Sam's Club的創新性“ Just Go”系統建立在其現有的AI驅動“掃描和GO”技術的基礎上,使會員可以在購物旅行期間通過Sam's Club應用程序進行掃描。

Nvidia的AI Omniverse在GTC 2025擴展Nvidia的AI Omniverse在GTC 2025擴展Apr 22, 2025 am 11:28 AM

NVIDIA在GTC 2025上的增強可預測性和新產品陣容 NVIDIA是AI基礎架構的關鍵參與者,正在專注於提高其客戶的可預測性。 這涉及一致的產品交付,達到績效期望以及

探索Google的功能探索Google的功能Apr 22, 2025 am 11:26 AM

Google的Gemma 2:強大,高效的語言模型 Google的Gemma語言模型家族以效率和性能而慶祝,隨著Gemma 2的到來而擴展。此最新版本包括兩種模型:270億個參數VER

下一波《 Genai:與Kirk Borne博士的觀點》 -Analytics Vidhya下一波《 Genai:與Kirk Borne博士的觀點》 -Analytics VidhyaApr 22, 2025 am 11:21 AM

這一領先的數據劇集以數據科學家,天體物理學家和TEDX演講者Kirk Borne博士為特色。 Borne博士是大數據,AI和機器學習的著名專家,為當前狀態和未來的Traje提供了寶貴的見解

AI適合跑步者和運動員:我們取得了出色的進步AI適合跑步者和運動員:我們取得了出色的進步Apr 22, 2025 am 11:12 AM

這次演講中出現了一些非常有見地的觀點——關於工程學的背景信息,這些信息向我們展示了為什麼人工智能如此擅長支持人們的體育鍛煉。 我將從每位貢獻者的觀點中概括出一個核心思想,以展示三個設計方面,這些方面是我們探索人工智能在體育運動中應用的重要組成部分。 邊緣設備和原始個人數據 關於人工智能的這個想法實際上包含兩個組成部分——一個與我們放置大型語言模型的位置有關,另一個與我們人類語言和我們的生命體徵在實時測量時“表達”的語言之間的差異有關。 Alexander Amini 對跑步和網球都很了解,但他還

傑米·恩格斯特羅姆(Jamie Engstrom)關於卡特彼勒的技術,人才和轉型傑米·恩格斯特羅姆(Jamie Engstrom)關於卡特彼勒的技術,人才和轉型Apr 22, 2025 am 11:10 AM

卡特彼勒(Caterpillar)的首席信息官兼高級副總裁傑米·恩格斯特(Jamie Engstrom)領導了一支由28個國家 /地區的2200多名IT專業人員組成的全球團隊。 在卡特彼勒(Caterpillar)工作了26年,其中包括她目前的四年半,Engst

新的Google照片更新使任何具有Ultra HDR質量的照片流行新的Google照片更新使任何具有Ultra HDR質量的照片流行Apr 22, 2025 am 11:09 AM

Google Photos的新Ultra HDR工具:快速指南 使用Google Photos的新型Ultra HDR工具增強照片,將標準圖像轉換為充滿活力的高動態範圍傑作。對於社交媒體而言,此工具可提高任何照片的影響,

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

Safe Exam Browser

Safe Exam Browser

Safe Exam Browser是一個安全的瀏覽器環境,安全地進行線上考試。該軟體將任何電腦變成一個安全的工作站。它控制對任何實用工具的訪問,並防止學生使用未經授權的資源。

Atom編輯器mac版下載

Atom編輯器mac版下載

最受歡迎的的開源編輯器

EditPlus 中文破解版

EditPlus 中文破解版

體積小,語法高亮,不支援程式碼提示功能

SecLists

SecLists

SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。