LlamaIndex を使用した単純な RAG エージェントの構築-Python チュートリアル-php.cn

ホームページ

バックエンド開発

Python チュートリアル

LlamaIndex を使用した単純な RAG エージェントの構築

DDD

Oct 01, 2024 am 06:38 AM

Building a simple RAG agent with LlamaIndex

LlamaIndex は、LLM を使用してコンテキスト拡張された生成 AI アプリケーションを構築するためのフレームワークです。

コンテキスト拡張とは何ですか?

コンテキスト拡張とは、追加の関連情報またはコンテキストを LLM モデルに提供し、特定のクエリに対する理解と応答を向上させる手法を指します。この拡張には通常、ドキュメントや埋め込みなどの外部データソースの取得、統合、またはモデルの入力への添付が含まれます。目標は、モデルに必要なコンテキストを提供することで、モデルがより適切で正確かつ微妙な答えを出せるようにすることで、より多くの情報を提供することです。検索拡張生成 (RAG) は、コンテキスト拡張の最も一般的な例です。

エージェントとは何ですか?

エージェントは、ツールを使用して調査、データ抽出、Web 検索などのタスクを実行する LLM を利用した自動化された推論および意思決定エンジンです。これらは、データに基づいた質問応答から、タスクを完了するために決定してアクションを実行できるようにするなどの単純なユースケースに使用できます。

この投稿では、LlamaIndex を使用して単純な RAG エージェントを構築します。

RAG エージェントの構築

依存関係のインストール

Python を使用して、LlamaIndex を使用する単純な RAG エージェントを構築します。まず、以下のように必要な依存関係をインストールしましょう:

pip install llama-index python-dotenv

LLM のセットアップとドキュメントのロード

OpenAI の gpt-4o-mini を LLM として使用します。 API キーを環境変数ファイルに置く必要があります。 LLamaIndex を使用したローカル LLM のセットアップの詳細については、こちらをご覧ください。

from llama_index.core import SimpleDirectoryReader, VectorStoreIndex, Settings
from llama_index.llms.openai import OpenAI
from dotenv import load_dotenv

# Load environment variables (e.g., OPENAI_API_KEY)
load_dotenv()

# Configure OpenAI model
Settings.llm = OpenAI(model="gpt-4o-mini")

# Load documents from the local directory
documents = SimpleDirectoryReader("./data").load_data()

# Create an index from documents for querying
index = VectorStoreIndex.from_documents(documents)
query_engine = index.as_query_engine()

まず、OpenAI を使用し、gpt-4o-mini モデルを指定して LLM モデルを構成します。ニーズに応じて、他の利用可能なモデル/LLM に切り替えることができます。
次に、SimpleDirectoryReader を使用して、ローカルの ./data ディレクトリからドキュメントを読み込みます。このリーダーはディレクトリをスキャンし、ファイルを読み取り、クエリ用にデータを構造化します。
次に、ロードされたドキュメントからベクターストアインデックスを作成します。これにより、クエリの実行中に効率的なベクターベースの検索を実行できるようになります。

エージェント用のカスタム関数の作成

次に、エージェントがタスクを実行するために使用できる基本的な関数をいくつか定義しましょう。

def multiply(a: float, b: float) -> float:
    """Multiply two numbers and returns the product"""
    return a * b

def add(a: float, b: float) -> float:
    """Add two numbers and returns the sum"""
    return a + b

エージェント用のツールを作成する

次に、前に定義した関数とクエリエンジンから、エージェントがタスクを実行するために使用するツールを作成します。これらのツールは、エージェントがさまざまな種類のクエリを処理するときに利用できるユーティリティとして機能します。

from llama_index.core.tools import FunctionTool, QueryEngineTool

# Wrap functions as tools
add_tool = FunctionTool.from_defaults(fn=add)
multiply_tool = FunctionTool.from_defaults(fn=multiply)

# Create a query engine tool for document retrieval
space_facts_tool = QueryEngineTool.from_defaults(
    query_engine,
    name="space_facts_tool",
    description="A RAG engine with information about fun space facts."
)

FunctionTool は加算関数と乗算関数をラップし、ツールとして公開します。エージェントはこれらのツールにアクセスして計算を実行できるようになりました。
QueryEngineTool は query_engine をラップして、エージェントがクエリを実行し、ベクトルストアから情報を取得できるようにします。このツールが宇宙の事実に関する情報を取得できることを示す説明を付けて、space_facts_tool という名前を付けました。あらゆるものを取り込み、取り込んだデータに応じてツールをカスタマイズできます。

エージェントの作成

ReActAgent を使用してエージェントを作成します。エージェントは、ツールをいつ使用するか、クエリにどのように応答するかを決定する責任を負います。

from llama_index.core.agent import ReActAgent

# Create the agent with the tools
agent = ReActAgent.from_tools(
    [multiply_tool, add_tool, space_facts_tool], verbose=True
)

このエージェントは ReAct フレームワークを使用します。これにより、論理的な順序で指定されたツールを利用することで、モデルが推論し、行動することが可能になります。エージェントは作成したツールを使用して初期化され、verbose=True フラグにより、エージェントがタスクをどのように判断して実行するかに関する詳細情報が出力されます。

エージェントの実行

最後に、エージェントを対話型ループで実行して、終了するまでユーザーのクエリを処理しましょう。

while True:
    query = input("Query: ")

    if query == "/bye":
        exit()

    response = agent.chat(query)
    print(response)
    print("-" * 10)

RAG エージェントはどのように機能しますか?

取り込んだドキュメントに関連する質問をすると、space_facts_tool、つまりベクターストアツールは、query_engine を使用して関連情報を取得します。
計算を要求すると、エージェントは add_tool または multiply_tool を使用してそれらのタスクを実行します。
エージェントは、ユーザーのクエリに基づいてどのツールを使用するかをその場で決定し、出力を提供します。

以上がLlamaIndex を使用した単純な RAG エージェントの構築の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

Pythonと時間：勉強時間を最大限に活用するApr 14, 2025 am 12:02 AM

限られた時間でPythonの学習効率を最大化するには、PythonのDateTime、時間、およびスケジュールモジュールを使用できます。 1. DateTimeモジュールは、学習時間を記録および計画するために使用されます。 2。時間モジュールは、勉強と休息の時間を設定するのに役立ちます。 3.スケジュールモジュールは、毎週の学習タスクを自動的に配置します。

Python：ゲーム、GUIなどApr 13, 2025 am 12:14 AM

PythonはゲームとGUI開発に優れています。 1）ゲーム開発は、2Dゲームの作成に適した図面、オーディオ、その他の機能を提供し、Pygameを使用します。 2）GUI開発は、TKINTERまたはPYQTを選択できます。 TKINTERはシンプルで使いやすく、PYQTは豊富な機能を備えており、専門能力開発に適しています。

Python vs. C：比較されたアプリケーションとユースケースApr 12, 2025 am 12:01 AM

Pythonは、データサイエンス、Web開発、自動化タスクに適していますが、Cはシステムプログラミング、ゲーム開発、組み込みシステムに適しています。 Pythonは、そのシンプルさと強力なエコシステムで知られていますが、Cは高性能および基礎となる制御機能で知られています。

2時間のPython計画：現実的なアプローチApr 11, 2025 am 12:04 AM

2時間以内にPythonの基本的なプログラミングの概念とスキルを学ぶことができます。 1.変数とデータ型、2。マスターコントロールフロー（条件付きステートメントとループ）、3。機能の定義と使用を理解する4。

Python：主要なアプリケーションの調査Apr 10, 2025 am 09:41 AM

Pythonは、Web開発、データサイエンス、機械学習、自動化、スクリプトの分野で広く使用されています。 1）Web開発では、DjangoおよびFlask Frameworksが開発プロセスを簡素化します。 2）データサイエンスと機械学習の分野では、Numpy、Pandas、Scikit-Learn、Tensorflowライブラリが強力なサポートを提供します。 3）自動化とスクリプトの観点から、Pythonは自動テストやシステム管理などのタスクに適しています。