LLMチャットボット:検索拡張生成(RAG)
で会話型AIに革命をもたらすChatGPTの2022年11月の発売以来、大規模な言語モデル(LLM)チャットボットは遍在し、さまざまなアプリケーションを変換しています。 チャットボットの概念は新しいものではありませんが、多くの古いチャットボットは過度に複雑でイライラしていましたが、llmはフィールドを活性化しました。このブログでは、LLMSの力、検索拡張生成(RAG)技術、およびOpenaiのGPT APIとPineconeを使用して独自のチャットボットを構築する方法を探ります。
このガイドがカバーしています:
- 検索拡張生成(rag)
- 大手言語モデル(LLMS)
- Openai GPTおよびその他のAPIを使用して
- ベクトルデータベースとその必要性
- python
- でPineconeとOpenaiを使用したチャットボットを作成します より深いダイビングについては、Pineconeを備えた埋め込みと、Openai APIとPineconeの構築チャットボットに並ぶコードを埋め込んでいるベクトルデータベースのコースを探索してください
大手言語モデル(LLMS)
画像ソース
LLMは、人間の言語を理解して生成するために、深い学習(具体的には変圧器アーキテクチャ)を採用する洗練された機械学習アルゴリズムです。大規模なデータセット(多様なオンラインソースからの数兆語)でトレーニングされているため、複雑な言語タスクを処理します。 llmsは、創造的なライティングから技術文書まで、さまざまなスタイルや形式のテキスト生成に優れています。 それらの能力には、要約、会話型AI、言語翻訳が含まれ、しばしば微妙な言語機能をキャプチャします。 ただし、LLMには制限があります。 「幻覚」 - もっともらしいが誤った情報を生成し、トレーニングデータからのバイアスは重要な課題です。 LLMは主要なAIの進歩を表していますが、リスクを軽減するには慎重な管理が重要です。 検索拡張生成(rag)
画像ソース
llmsの制限(データの制限または「幻覚」による時代遅れ、一般的、または誤った情報)は、ragによって対処されます。 RAGは、指定されたソースから関連情報を取得するようLLMを指示することにより、精度と信頼性を向上させます。 これにより、開発者はLLM応答をより多く制御できます
ragプロセス(簡素化)
- データの準備:外部データ(例:現在の研究、ニュース)が準備され、LLMが使用できる形式(埋め込み)に変換されます。
- 埋め込みストレージ:埋め込みはベクターデータベース(Pineconeなど)に保存され、効率的なベクターデータ検索用に最適化されています。 情報検索:
- ユーザーのクエリを使用したセマンティック検索(ベクトルに変換)は、データベースから最も関連性の高い情報を取得します。 プロンプトの増強: 取得データとユーザークエリはLLMプロンプトを増やし、より正確な応答につながります。
- データの更新:外部データは、精度を維持するために定期的に更新されます。
- Vectorデータベース
openai api OpenaiのAPIは、GPT、Dall-E、Whisperなどのモデルへのアクセスを提供します。 HTTPリクエストを介してアクセス可能(またはPythonの
ライブラリで簡素化されています)、さまざまなプログラミング言語に簡単に統合されています。pythonの例:
langchain(フレームワークの概要)
openai
LangchainはLLMアプリケーション開発を簡素化します。 強力ですが、まだアクティブな開発中であるため、APIの変更が可能です。
このセクションでは、Openai GPT-4とPineconeを使用してチャットボットを構築します。 (注:このコードの多くは、公式のPinecone Langchain Guideから採用されています。)
1。 OpenaiおよびPineconeセットアップ:APIキーを取得します
2。 ライブラリをインストールする:PIPを使用して、langchain
、langchain-community
、openai
、tiktoken
、およびpinecone-client
。
pinecone-datasets
3。 サンプルデータセット:事前に埋め込まれたデータセットをロードします(例:
from)。 (より速い処理にはサブセットのサンプリングをお勧めします。)wikipedia-simple-text-embedding-ada-002-100K
pinecone-datasets
4。 Pinecone Indexのセットアップ:Pineconeインデックスを作成します(この例では
)。
5。 データの挿入:サンプリングされたデータをPineconeインデックスに上げます。
langchain-retrieval-augmentation-fast
6。 Langchain Integration:Pinecone IndexとOpenai Embeddingsを使用してLangchain Vectorストアを初期化します。
7。 クエリ:ベクトルストアを使用して、類似性検索を実行します
8。 LLMの統合:
および)を使用して、LLMをベクトルストアと統合します。
結論
ChatOpenAI
このブログは、信頼できる関連性のあるLLM駆動のチャットボットを構築するためのRAGの力を示しました。 LLMS、ベクトルデータベース(Pineconeなど)、およびLangchainのようなフレームワークの組み合わせにより、開発者が洗練された会話型AIアプリケーションを作成できるようになります。 私たちのコースは、これらの分野でさらなる学習機会を提供します
以上がOpenai APIとPineconeを使用してチャットボットを構築する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

導入 迅速なエンジニアリングでは、「思考のグラフ」とは、グラフ理論を使用してAIの推論プロセスを構造化および導く新しいアプローチを指します。しばしば線形sを含む従来の方法とは異なります

導入 おめでとう!あなたは成功したビジネスを運営しています。ウェブページ、ソーシャルメディアキャンペーン、ウェビナー、会議、無料リソース、その他のソースを通じて、毎日5000の電子メールIDを収集します。次の明白なステップはです

導入 今日のペースの速いソフトウェア開発環境では、最適なアプリケーションパフォーマンスが重要です。応答時間、エラーレート、リソース利用などのリアルタイムメトリックを監視することで、メインに役立ちます

「ユーザーは何人いますか?」彼は突き出した。 「私たちが最後に言ったのは毎週5億人のアクティブであり、非常に急速に成長していると思います」とアルトマンは答えました。 「わずか数週間で2倍になったと言った」とアンダーソンは続けた。 「私はそのprivと言いました

導入 Mistralは、最初のマルチモーダルモデル、つまりPixtral-12B-2409をリリースしました。このモデルは、Mistralの120億個のパラメーターであるNemo 12bに基づいて構築されています。このモデルを際立たせるものは何ですか?これで、画像とTexの両方を採用できます

クエリに応答するだけでなく、情報を自律的に収集し、タスクを実行し、テキスト、画像、コードなどの複数のタイプのデータを処理するAIを搭載したアシスタントがいることを想像してください。未来的に聞こえますか?これでa

導入 金融業界は、効率的な取引と信用の可用性を促進することにより経済成長を促進するため、あらゆる国の発展の基礎となっています。取引の容易さとクレジット

導入 データは、ソーシャルメディア、金融取引、eコマースプラットフォームなどのソースから前例のないレートで生成されています。この連続的な情報ストリームを処理することは課題ですが、


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

AtomエディタMac版ダウンロード
最も人気のあるオープンソースエディター

ZendStudio 13.5.1 Mac
強力な PHP 統合開発環境

SublimeText3 中国語版
中国語版、とても使いやすい

WebStorm Mac版
便利なJavaScript開発ツール

VSCode Windows 64 ビットのダウンロード
Microsoft によって発売された無料で強力な IDE エディター
