LLMチャットボット:検索拡張生成(RAG)
で会話型AIに革命をもたらすChatGPTの2022年11月の発売以来、大規模な言語モデル(LLM)チャットボットは遍在し、さまざまなアプリケーションを変換しています。 チャットボットの概念は新しいものではありませんが、多くの古いチャットボットは過度に複雑でイライラしていましたが、llmはフィールドを活性化しました。このブログでは、LLMSの力、検索拡張生成(RAG)技術、およびOpenaiのGPT APIとPineconeを使用して独自のチャットボットを構築する方法を探ります。
このガイドがカバーしています:
- 検索拡張生成(rag)
- 大手言語モデル(LLMS)
- Openai GPTおよびその他のAPIを使用して
- ベクトルデータベースとその必要性
- python
- でPineconeとOpenaiを使用したチャットボットを作成します より深いダイビングについては、Pineconeを備えた埋め込みと、Openai APIとPineconeの構築チャットボットに並ぶコードを埋め込んでいるベクトルデータベースのコースを探索してください
大手言語モデル(LLMS)
画像ソース
LLMは、人間の言語を理解して生成するために、深い学習(具体的には変圧器アーキテクチャ)を採用する洗練された機械学習アルゴリズムです。大規模なデータセット(多様なオンラインソースからの数兆語)でトレーニングされているため、複雑な言語タスクを処理します。 llmsは、創造的なライティングから技術文書まで、さまざまなスタイルや形式のテキスト生成に優れています。 それらの能力には、要約、会話型AI、言語翻訳が含まれ、しばしば微妙な言語機能をキャプチャします。 ただし、LLMには制限があります。 「幻覚」 - もっともらしいが誤った情報を生成し、トレーニングデータからのバイアスは重要な課題です。 LLMは主要なAIの進歩を表していますが、リスクを軽減するには慎重な管理が重要です。 検索拡張生成(rag)
画像ソース
llmsの制限(データの制限または「幻覚」による時代遅れ、一般的、または誤った情報)は、ragによって対処されます。 RAGは、指定されたソースから関連情報を取得するようLLMを指示することにより、精度と信頼性を向上させます。 これにより、開発者はLLM応答をより多く制御できます
ragプロセス(簡素化)
- データの準備:外部データ(例:現在の研究、ニュース)が準備され、LLMが使用できる形式(埋め込み)に変換されます。
- 埋め込みストレージ:埋め込みはベクターデータベース(Pineconeなど)に保存され、効率的なベクターデータ検索用に最適化されています。 情報検索:
- ユーザーのクエリを使用したセマンティック検索(ベクトルに変換)は、データベースから最も関連性の高い情報を取得します。 プロンプトの増強: 取得データとユーザークエリはLLMプロンプトを増やし、より正確な応答につながります。
- データの更新:外部データは、精度を維持するために定期的に更新されます。
- Vectorデータベース
openai api OpenaiのAPIは、GPT、Dall-E、Whisperなどのモデルへのアクセスを提供します。 HTTPリクエストを介してアクセス可能(またはPythonの
ライブラリで簡素化されています)、さまざまなプログラミング言語に簡単に統合されています。pythonの例:
langchain(フレームワークの概要)
openai
LangchainはLLMアプリケーション開発を簡素化します。 強力ですが、まだアクティブな開発中であるため、APIの変更が可能です。
このセクションでは、Openai GPT-4とPineconeを使用してチャットボットを構築します。 (注:このコードの多くは、公式のPinecone Langchain Guideから採用されています。)
1。 OpenaiおよびPineconeセットアップ:APIキーを取得します
2。 ライブラリをインストールする:PIPを使用して、langchain
、langchain-community
、openai
、tiktoken
、およびpinecone-client
。
pinecone-datasets
3。 サンプルデータセット:事前に埋め込まれたデータセットをロードします(例:
from)。 (より速い処理にはサブセットのサンプリングをお勧めします。)wikipedia-simple-text-embedding-ada-002-100K
pinecone-datasets
4。 Pinecone Indexのセットアップ:Pineconeインデックスを作成します(この例では
)。
5。 データの挿入:サンプリングされたデータをPineconeインデックスに上げます。
langchain-retrieval-augmentation-fast
6。 Langchain Integration:Pinecone IndexとOpenai Embeddingsを使用してLangchain Vectorストアを初期化します。
7。 クエリ:ベクトルストアを使用して、類似性検索を実行します
8。 LLMの統合:
および)を使用して、LLMをベクトルストアと統合します。
結論
ChatOpenAI
このブログは、信頼できる関連性のあるLLM駆動のチャットボットを構築するためのRAGの力を示しました。 LLMS、ベクトルデータベース(Pineconeなど)、およびLangchainのようなフレームワークの組み合わせにより、開発者が洗練された会話型AIアプリケーションを作成できるようになります。 私たちのコースは、これらの分野でさらなる学習機会を提供します
以上がOpenai APIとPineconeを使用してチャットボットを構築する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

AIフィールドの評価メトリックとしての「バイブ」の使用の増加について説明しましょう。この分析は、AIの進歩に関する私の進行中のフォーブスコラムの一部であり、AI開発の複雑な側面を調査します(こちらのリンクを参照)。 AI評価のバイブ TRADI

Waymo's Arizona Factory:大量生産する自動運転ジャガー以上 アリゾナ州フェニックスの近くに位置するWaymoは、自律的なジャガーIペースの電気SUVの艦隊を生産する最先端の施設を運営しています。 この239,000平方フィートの工場がオープンしました

S&PグローバルのチーフデジタルソリューションオフィサーであるJigar Kocherlakotaは、同社のAIの旅、戦略的買収、将来に焦点を当てたデジタル変革について議論しています。 変革的なリーダーシップの役割と将来の準備ができています コチェルラコタの役割

アプリからエコシステムまで:デジタル景観のナビゲート デジタル革命は、ソーシャルメディアとAIをはるかに超えています。 私たちは、「すべてのアプリ」の台頭を目撃しています。 サムa

MasterCardのエージェント給与:AI搭載の支払いは、コマースに革命をもたらします VisaのAIを搭載したトランザクション機能は見出しになりましたが、MasterCardはトークン化、信頼、およびエージェントに基づいて構築されたより高度なAI-Native支払いシステムであるエージェントペイを発表しました。

Future Ventures Fund IV:新しいテクノロジーに200万ドルの賭け Future Venturesは最近、過度にサブスクライブされたファンドIVを閉鎖し、合計2億ドルです。 Steve Jurvetson、Maryanna Saenko、およびNico Enriquezが管理するこの新しい基金は、重要なInvを表しています

AIアプリケーションの爆発により、企業は従来の検索エンジン最適化(SEO)から生成エンジン最適化(GEO)に移行しています。 Googleがシフトをリードしています。その「AIの概要」機能は、10億人以上のユーザーにサービスを提供しており、ユーザーがリンクをクリックする前に完全な回答を提供しています。 [^2] 他の参加者も急速に上昇しています。 ChatGpt、Microsoft Copilot、Perplexityは、従来の検索結果を完全にバイパスする新しい「Answer Engine」カテゴリを作成しています。 これらのAIに生成された回答にビジネスが表示されない場合、従来の検索結果で高くランク付けされていても、潜在的な顧客は決してあなたを見つけることはありません。 SEOからGeoまで - これは正確に何を意味しますか? 何十年もの間

人工一般情報(AGI)への潜在的なパスを探りましょう。 この分析は、AIの進歩に関する私の進行中のフォーブスコラムの一部であり、AGIと人工的な緊急事態(ASI)を達成する複雑さを掘り下げています。 (関連するアートを参照してください


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

EditPlus 中国語クラック版
サイズが小さく、構文の強調表示、コード プロンプト機能はサポートされていません

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

PhpStorm Mac バージョン
最新(2018.2.1)のプロフェッショナル向けPHP統合開発ツール

VSCode Windows 64 ビットのダウンロード
Microsoft によって発売された無料で強力な IDE エディター

mPDF
mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。
