この実践的なガイドでは、DeepSeek-R1モデルを使用して、EasyocrおよびGradioと統合された数学パズルソルバーアシスタントを構築します。
幅広い数学パズルを解決し、DeepSeek R1モデルの優れた推論機能を使用して有用なソリューションを生成できる機能的なWebアプリを構築する方法を段階的に説明します。
deepseek-r1の概要のみを取得したい場合は、このdeepseek-r1の概要を確認することをお勧めします。モデルを微調整するには、このチュートリアルを微調整するdeepseek-r1をお勧めします。
deepseek-r1デモプロジェクト:概要
パズルソルバーアシスタントを構築するには、次の手順について説明します。
必要な前提条件を設定します。
最適化された構成でモデルを初期化します。
モデルの指示機能を使用して、コア関数を定義します。
- コンポーネントをユーザーフレンドリーなグラデーションインターフェイスに統合して、簡単にインタラクションしてください。
- ステップ1:前提条件
- 実装に飛び込む前に、次のツールとライブラリがインストールされていることを確認しましょう。
- python 3.8
Pytorch:効率的な深い学習モデルの取り扱いについては
easyocr:画像からテキストを抽出するためのPythonモジュール。
Gradio:ユーザーフレンドリーなWebインターフェイスを作成します
次のコマンドを実行して、必要な依存関係をインストールします
-
上記の依存関係がインストールされたら、次のインポートコマンドを実行します。
-
ステップ2:DeepSeek-R1 API - のセットアップ
次のスクリプトでは、ユーザープロンプトに基づいて応答を取得するためにDeepSeek APIと対話する方法を示しています。 DeepSeekのAPIはOpenaiの形式と互換性があり、APIリクエストにベースURLを使用していることに注意してください。
- APIキーに直接渡すことができます(プライバシー上の理由で推奨されません)、または私のようなGoogle Colabを使用する場合は、Secrets機能を使用してAPIキーを保存できます。または、環境変数を使用できます
この記事を公開している時点で、Deepseekのサービスは重い負荷がかかり、パフォーマンスが低下しています。また、このプロジェクトのコードを実行する大きな困難がありました。このプロジェクトでコードを実行しようとする前に、DeepSeekのステータスページを確認してください。
ステップ3:コア機能を設計する
APIが設定され、コード機能に取り組むことができます。このセクションでは、ロジックパズルを含む画像を処理し、OCRを使用してパズルテキストを抽出し、テキストを改良し、DeepSeek APIに送信して解決します。まずコードを見て、それから説明します。
!pip install torch gradio pillow easyocr -q
solve_puzzle()関数は、ロジックパズルを含む画像を処理し、OCRおよびR1モデルを使用して解決します。これらの手順に従います:
Import torch
from PIL import Image
import easyocr
import requests
import json
import gradio as gr
画像処理:アップロードされた画像は一時的に保存され、Easyocrを使用してテキストを抽出して処理されます。
テキストの洗練:抽出されたテキストは、一貫性と精度を確保するために標準化されています。
- クエリ構成:洗練されたパズルテキストや解決のための特定の手順を含む構造化クエリが作成されます。
APIインタラクション:クエリはDeepSeek APIに送信され、パズルを分析および解決します。 DeepSeek-Reasonerモデルを使用して、DeepSeek-R1を使用してください。 deepseek-v3を使用する場合は、deepseek-chatを使用してください。そして、常に価格設定に注意してくださいので、最新情報については価格設定ページを確認してください。
- 応答処理:API応答は、ソリューションまたは適切なエラーメッセージを抽出して返すように処理されます。
エラー処理:この関数は、タイムアウトや予期しない例外などの問題も管理し、堅牢な操作を確保します。
-
このパイプラインは、テキスト抽出用のOCRとインテリジェントパズルソービング用のDeepSeek APIを組み合わせています。
ステップ4:グレードインターフェイスの作成-
Gradioを使用すると、アプリケーション用のインタラクティブなWebインターフェイスを作成できます。次のコードスニペットは、solve_puzzle()関数用のユーザーフレンドリーなグラデーションWebインターフェイスを作成します。 Gradio Interfaceは、ユーザーの入力を取得し、検証のためにモデルに渡します。
-
上記のセットアップには、3つのコンポーネントが含まれています
-
入力:ユーザーが画像をアップロードできるgr.imageコンポーネント。
出力:deepseek-r1から答えを表示するためのテキストコンポーネント。
インターフェイス:gr.interface()関数は入力と出力を結び付け、ユーザーインタラクション用のWebアプリを起動します。
ステップ5:アプリをテストします
数学と論理を伴うパズルでアプリをテストしましょう。
!pip install torch gradio pillow easyocr -q
最初の行を見ると、1 4 = 5が表示されます。これは簡単な追加だと言えます。ただし、2行目には2 5 = 12があり、次に3 6 = 21があります。パターンを把握して解決できますか?
グレードインターフェイスの右側を見ると、パズルソルバーアプリがパターンを特定していることがわかります。
-
結論-
このチュートリアルでは、deepseek R1とOCRとグラデーションを組み合わせて数学パズルを解決する数学パズルソルバーアシスタントを構築しました。最新のAIに遅れずについていくには、これらのブログをお勧めします。
- qwen 2.5-max
DeepseekのJanus-Pro
deepseek janus-proをローカルに使用する方法
以上がGradioとEasyocrを備えたDeepSeek-R1デモプロジェクトの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。