DeepSeek R1を使用してRAGシステムを構築する方法は？-AI-php.cn

ホームページ

テクノロジー周辺機器

DeepSeek R1を使用してRAGシステムを構築する方法は？

William Shakespeare

Mar 07, 2025 am 09:39 AM

私はRAGおよびAIエージェントについて多くのことを読んでいますが、DeepSeek V3やDeepSeek R1などの新しいモデルのリリースにより、効率的なRAGシステムを構築する可能性が大幅に改善され、実質的な適用のためのより良い検索能力、推論能力の向上、よりスケーラブルなアーキテクチャが提供されたようです。より洗練された検索メカニズム、強化された微調整オプション、およびマルチモーダル機能の統合により、AIエージェントがデータと相互作用する方法が変化しています。従来のぼろきれのアプローチが依然として今後の最良の方法であるか、または新しいアーキテクチャがより効率的で文脈的に認識されるソリューションを提供できるかどうかについて疑問を投げかけます。

検索された生成（RAG）システムは、AIモデルが検索ベースと生成アプローチを組み合わせて、より正確でコンテキストを意識した応答を生成することにより、データとの相互作用の方法に革命をもたらしました。効率と費用対効果で知られているオープンソースモデルであるdeepseek r1の出現により、効果的なRAGシステムの構築は、よりアクセスしやすく実用的になりました。この記事では、DeepSeek R1を使用してRAGシステムを構築しています。目次

deepseek r1をRAGシステムに使用することの利点
deepseek r1
コードを使用してRAGシステムを構築するためのRAGシステムを構築して、DeepSeek R1 deepseek r1とは？
deepseek R1

は、OpenAIの提供などの独自モデルの一部のコストで高品質の推論と検索機能を提供することを目的として開発されたオープンソースAIモデルです。 MITライセンスを備えており、商業的に実行可能で、幅広いアプリケーションに適しています。また、この強力なモデルでは、ベッドを見ることができますが、Openai O1とO1-Miniは推論のトークンを示していません。

Deepseek R1がOpenai O1モデルにどのように挑戦しているかを知るには：Deepseek R1対Openai O1：どれがより速く、より安く、賢いものですか？

RAGシステムにDeepSeek R1を使用することの利点 DeepSeek-R1を使用した検索総生成（RAG）システムの構築には、いくつかの顕著な利点があります。 1。高度な推論機能

：Deepseek-R1は、結論に達する前に情報を段階的に分析および処理することにより、人間のような推論をエミュレートします。このアプローチは、特に論理的推論、数学的推論、コーディングタスクを必要とする領域で、複雑なクエリを処理するシステムの能力を高めます。

2。オープンソースのアクセシビリティ

：MITライセンスの下でリリースされたDeepSeek-R1は完全にオープンソースであり、開発者がモデルへの無制限のアクセスを可能にします。このオープン性は、独自のモデルにしばしば関連する制約なしに、カスタマイズ、微調整、およびさまざまなアプリケーションへの統合を促進します。

3。競争力のあるパフォーマンス：ベンチマークテストは、Deepseek-R1が、推論、数学、コーディングを含むタスクでOpenaiのO1などの主要なモデルと同等またはそれを上回ることを示しています。このレベルのパフォーマンスにより、DeepSeek-R1で構築されたRAGシステムが、多様で挑戦的なクエリにわたって高品質で正確な応答を提供できるようになります。

4。思考プロセスの透明性：deepseek-r1は、「思考の連鎖」方法論を採用しており、推論中に推論ステップを表示します。この透明性は、意思決定プロセスに関する明確な洞察を提供することにより、ユーザーの信頼を構築しながらシステムをデバッグして改良するのに役立ちます。

5。費用対効果

：DeepSeek-R1のオープンソースの性質により、ライセンス料が排除され、その効率的なアーキテクチャは計算リソース要件を削減します。これらの要因は、かなりの費用を負担することなく、洗練されたRAGシステムを実装しようとしている組織にとって、より費用対効果の高いソリューションに貢献しています。 DeepSeek-R1をRAGシステムに統合すると、高度な推論能力、透明性、パフォーマンス、コスト効率の強力な組み合わせが提供され、AI機能を強化することを目的とした開発者や組織にとって説得力のある選択肢になります。 DeepSeek R1 を使用してRAGシステムを構築するための

ステップ

スクリプトは、検索された生成（RAG）パイプラインです

ページに分割してテキストを抽出することにより、PDFドキュメントをロードおよび処理します。

データベース内のテキストのベクトル化表現

クエリが尋ねられたときに類似性検索を使用して、関連するコンテンツを取得します。
を使用して、取得したテキストに基づいて応答を生成します。前提条件をインストールします
オラマのダウンロード：
ここをクリックして：

この後、deepseek r1：1.5bを使用してプルします

これにはダウンロードに時間がかかります： これを行った後、jupyterノートブックを開いて、コーディングパーツから始めます：
実行する前に、スクリプトは必要なPythonライブラリをインストールします：
- langchain→大規模な言語モデル（LLMS）を使用してアプリケーションを構築するためのフレームワーク。
- langchain-community→さまざまなドキュメントローダーやユーティリティのサポートを追加します。
- を入力します Openaiの埋め込みモデルにアクセスするために、スクリプトはユーザーに
を安全に入力するように促します。これにより、単純なテキストで資格情報の公開が防止されます
3。環境変数をセットアップ

スクリプトは、APIキーを環境変数として保存します。これにより、コードの他の部分は、セキュリティを改善するハードコード資格情報を使用せずにOpenaiサービスにアクセスできます。 4。 Openai Embeddingsを初期化

スクリプトは、「Text-embedding-3-Small」と呼ばれるOpenAI埋め込みモデルを初期化します。このモデルは、テキストをベクトル埋め込み
に変換します。これは、テキストの意味の高次元数値表現です。これらの埋め込みは、後で
同様のコンテンツを比較および取得するために使用されます。 5。 PDFドキュメントをロードして分割します PDFファイル（agenticai.pdf）が
ロードされ、ページに分割されています。各ページテキストが抽出されているため、ドキュメント全体を単一のユニットとして処理する代わりに、
より小さくて管理しやすいテキストチャンクが可能になります。
6。ベクトルデータベースを作成して保存します
PDFから抽出されたテキストは、ベクトル埋め込みに変換されます。これらの埋め込みは、
chromadb
に保存されています。
データベースは
cosineの類似性を使用し、高度なセマンティックな類似性でテキストの効率的な検索を確保します。 7。類似のしきい値を使用して同様のテキストを取得します
a
retriver
は、chromadbを使用して作成されます
- 特定のクエリに基づいて、最も類似したトップ3のドキュメントを検索します。 フィルター類似のしきい値0.3に基づいて結果をフィルターします。つまり、ドキュメントは関連性としての資格を得るために少なくとも30％の類似性を持っている必要があります。
- 8。同様のドキュメントのクエリ 2つのテストクエリが使用されています：
- 結果は見つかりませんでした
「エージェントAIとは何ですか？」
関連するテキストを正常に取得し、システムが意味のあるコンテキストを取得できることを実証します。
- 9。ぼろ（検索の生成）チェーンを構築します
- rag pipeline
```
curl -fsSL https://ollama.com/install.sh | sh
```
しきい値検索との類似性
```
ollama pull deepseek-r1:1.5b
```
```
ollama pull deepseek-r1:1.5b

pulling manifest
pulling aabd4debf0c8... 100% ▕████████████████▏ 1.1 GB                         
pulling 369ca498f347... 100% ▕████████████████▏  387 B                         
pulling 6e4c38e1172f... 100% ▕████████████████▏ 1.1 KB                         
pulling f4d24e9138dd... 100% ▕████████████████▏  148 B                         
pulling a85fe2a2e58e... 100% ▕████████████████▏  487 B                         
verifying sha256 digest 
writing manifest 
success 
```
```
!pip install langchain==0.3.11
!pip install langchain-openai==0.2.12
!pip install langchain-community==0.3.11
!pip install langchain-chroma==0.1.4
```
ラグチェーンを構築します
```
from getpass import getpass
OPENAI_KEY = getpass('Enter Open AI API Key: ')
```
llm
への接続をロードします
ラグチェーンのlangchain構文
```
import os
os.environ['OPENAI_API_KEY'] = OPENAI_KEY
```
```
from langchain_openai import OpenAIEmbeddings
openai_embed_model = OpenAIEmbeddings(model='text-embedding-3-small')
```
```
from langchain_community.document_loaders import PyPDFLoader
loader = PyPDFLoader('AgenticAI.pdf')
pages = loader.load_and_split()
texts = [doc.page_content for doc in pages]

from langchain_chroma import Chroma
chroma_db = Chroma.from_texts(
texts=texts,
collection_name='db_docs',
collection_metadata={"hnsw:space": "cosine"}, # Set distance function to cosine
embedding=openai_embed_model
)
```
deepseekの作業と同様のモデルとの比較に関する詳細な記事をチェックアウトしてください：
```
similarity_threshold_retriever = chroma_db.as_retriever(search_type="similarity_score_threshold",search_kwargs={"k": 3,"score_threshold": 0.3})

query = "what is the old capital of India?"
top3_docs = similarity_threshold_retriever.invoke(query)
top3_docs
```
Deepseek R1- OpenaiのO1最大の競争相手がここにいます！

deepseek-v3
```
[]
```
を使用したAIアプリケーションの構築
deepseek-v3 vs gpt-4o vs llama 3.3 70b
```
query = "What is Agentic AI?"
top3_docs = similarity_threshold_retriever.invoke(query)
top3_docs
```
deepseek v3 vs gpt-4o：どちらが良いですか？
deepseek r1 vs openai o1：どれが優れていますか？

deepseek janus pro 7b？
にアクセスする方法
- 結論

以上がDeepSeek R1を使用してRAGシステムを構築する方法は？の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

摩擦から流れへ：AIがどのように法的作業を変えているかMay 09, 2025 am 11:29 AM

法的技術革命は勢いを増し、法律専門家にAIソリューションを積極的に受け入れるように促しています。受動的抵抗は、競争力を維持することを目指している人にとってはもはや実行可能な選択肢ではありません。なぜテクノロジーの採用が重要なのですか？法律専門家

これはAIがあなたのことを考えており、あなたについて知っていることですMay 09, 2025 am 11:24 AM

多くの人は、AIとの相互作用が匿名であると仮定しており、人間のコミュニケーションとはまったく対照的です。ただし、AIはすべてのチャット中にユーザーを積極的にプロファイルします。すべてのプロンプト、すべての単語が分析および分類されます。 AI Revoのこの重要な側面を探りましょう

繁栄した、AIの準備ができている企業文化を構築するための7つのステップMay 09, 2025 am 11:23 AM

成功した人工知能戦略は、強力な企業文化サポートから分離することはできません。 Peter Druckerが言ったように、事業運営は人々に依存しており、人工知能の成功も依存しています。人工知能を積極的に受け入れる組織の場合、AIに適応する企業文化を構築することが重要であり、AI戦略の成功または失敗さえ決定します。ウェストモンローは最近、繁栄するAIに優しい企業文化を構築するための実用的なガイドをリリースしました。ここにいくつかの重要なポイントがあります。 1. AIの成功モデルを明確にする：まず第一に、AIがどのようにビジネスに力を与えることができるかについての明確なビジョンが必要です。理想的なAI操作文化は、人間とAIシステム間の作業プロセスの自然統合を実現できます。 AIは特定のタスクが得意であり、人間は創造性と判断が得意です

Netflix New Scroll、Meta AI＆＃x27;のゲームチェンジャー、Neuralinkは85億ドルで評価されていますMay 09, 2025 am 11:22 AM

メタはAIアシスタントアプリケーションをアップグレードし、ウェアラブルAIの時代が来ています！ ChatGPTと競合するように設計されたこのアプリは、テキスト、音声インタラクション、画像生成、Web検索などの標準的なAI機能を提供しますが、初めてジオロケーション機能を追加しました。これは、メタAIがあなたがどこにいるのか、あなたがあなたの質問に答えるときにあなたが何を見ているのかを知っていることを意味します。興味、場所、プロファイル、アクティビティ情報を使用して、これまで不可能な最新の状況情報を提供します。このアプリはリアルタイム翻訳もサポートしており、レイバンメガネのAIエクスペリエンスを完全に変更し、その有用性を大幅に改善しました。外国映画への関税の賦課は、メディアや文化に対する裸の力の行使です。実装された場合、これはAIと仮想生産に向かって加速します

AIサイバー犯罪から身を守るために、今日これらの手順を踏んでくださいMay 09, 2025 am 11:19 AM

人工知能は、サイバー犯罪の分野に革命をもたらし、新しい防御スキルを学ぶことを強いています。サイバー犯罪者は、ディープフォーファリーやインテリジェントなサイバー攻撃などの強力な人工知能技術を、前例のない規模で詐欺と破壊に使用しています。過去1年間、グローバルビジネスの87％がAIサイバー犯罪の標的を絞っていると報告されています。それでは、どうすればこの賢い犯罪の波の犠牲者になることを避けることができますか？リスクを特定し、個人および組織レベルで保護対策を講じる方法を探りましょう。サイバー犯罪者が人工知能をどのように使用するか技術が進むにつれて、犯罪者は、個人、企業、政府を攻撃する新しい方法を常に探しています。人工知能の広範な使用は最新の側面かもしれませんが、その潜在的な害は前例のないものです。特に、人工知能

共生ダンス：人工的および自然な知覚のナビゲートループMay 09, 2025 am 11:13 AM

人工知能（AI）と人間の知能（NI）の複雑な関係は、フィードバックループとして最もよく理解されています。人間はAIを作成し、人間の活動によって生成されたデータでそれをトレーニングして、人間の能力を強化または複製します。このai

AIの最大の秘密 - クリエイターはそれを理解していません、専門家は分裂しますMay 09, 2025 am 11:09 AM

人類の最近の声明は、最先端のAIモデルを取り巻く理解の欠如を強調しており、専門家の間で激しい議論を引き起こしました。この不透明度は本物の技術的危機ですか、それとも単により多くのソフへの道の一時的なハードルですか

Sarvam AIによるBulbul-V2：インドの最高のTTSモデルMay 09, 2025 am 10:52 AM

インドは、言語の豊かなタペストリーを備えた多様な国であり、地域間のシームレスなコミュニケーションを持続的な課題にしています。ただし、SarvamのBulbul-V2は、高度なテキストからスピーチ（TTS）Tでこのギャップを埋めるのに役立ちます。

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポートライブラリとヘッダーファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。