ここ数か月で、検索された世代(RAG)は、大規模な言語モデルと外部の知識を組み合わせるための強力な手法として人気が急上昇しています。ただし、適切なRAGパイプライン(インデックス化、埋め込みモデル、チャンキング方法、質問回答アプローチ)を選択することは困難です。数え切れないほどの構成があれば、どのパイプラインがデータとユースケースに最適であるかを確認するにはどうすればよいですか?それがAutoragが入ってくる場所です
学習目標- Autoragの基礎と、それがRAGパイプラインの最適化を自動化する方法を理解してください。
- データのさまざまなRAG構成をautoragがどのように体系的に評価するかを学びます。
- データ作成、パイプライン実験、展開など、Autoragの主要な機能を探索します。 Autoragのセットアップと使用のステップバイステップのウォークスルーで実践的なエクスペリエンスを獲得します。
- AutORAGの自動化されたワークフローを使用して、最高のパフォーマンスのあるRAGパイプラインを展開する方法を発見してください。
- この記事は、
データサイエンスブログの一部として公開されました。 目次autoragとは何ですか?autoragがラグパイプラインを最適化する方法autorag
結論
- よくある質問
- autoragとは?
- Autoragは、ぼろきれに焦点を当てたオープンソースの自動機械学習(Automl)ツールです。独自のデータセット上のさまざまなRAGパイプラインコンポーネントを体系的にテストおよび評価して、ユースケースに最適な構成を決定します。実験を自動的に実行する(およびデータ作成、チャンキング、QAデータセット生成、パイプラインの展開などのタスクを処理することで、Autoragは時間と手間を節約します。
なぜautorag?
- 多数のRAGパイプラインとモジュール:RAGシステムを構成する多くの可能な方法があります。
- 時間のかかる実験:すべてのパイプラインを自分のデータで手動でテストするのは面倒です。ほとんどの人は決してそれをしません。つまり、パフォーマンスの向上や推論を逃している可能性があります。 データとユースケースに合わせて調整された :汎用ベンチマークは、ユニークなコーパスでパイプラインがどれだけうまく機能するかを反映していない場合があります。 Autoragは、独自のデータから派生した実際のQAペアまたは合成QAペアで評価できるようにすることにより、当て推量を削除します。
- キー機能
データ作成
:Autoragでは、独自の生文書、PDFファイル、またはその他のテキストソースからRAG評価データを作成できます。ファイルをアップロードして、raw.parquetに解析し、それらをcorpus.parquetにchunkし、qaデータセットを自動的に生成します。- 最適化:Autoragは、データに最適なラグパイプラインを発見するために、実行中の実験(ハイパーパラメーターチューニング、パイプライン選択など)を自動化します。 QAデータセットに対する精度、関連性、事実上の正確性などのメトリックを測定して、最高のパフォーマンスのセットアップを特定します。 展開
- :最高のパイプラインを特定したら、Autoragは展開を簡単にします。単一のYAML構成では、最適なパイプラインをフラスコサーバーまたは選択した別の環境に展開できます。 顔のスペースを抱きしめてグラデーションで構築されています
- Autoragのユーザーフレンドリーなインターフェイスは、Gradioを使用して構築されており、フェイススペースを抱き締めるのは簡単です。インタラクティブなGUIは、これらの実験を実行するために深い技術的専門知識を必要としないことを意味します。データをアップロードし、パラメーターを選択し、結果を生成する手順に従ってください。 autoragがragパイプラインを最適化する方法 QAデータセットを手にすると、AutORAGは自動的に:
複数のレトリバータイプ
(例えば、ベクトルベース、キーワード、ハイブリッド)をテストします。さまざまなチャンクサイズを探索し、戦略をオーバーラップします。
- 埋め込みモデルを評価(たとえば、Openai Embeddings、Hugging Face Transformers)。
- プロンプトテンプレートを調整最も正確または関連する回答を生成するかを確認します。 正確な一致、F1スコア、カスタムドメイン固有のメトリックなどのメトリックを使用して、QAデータセットに対するパフォーマンスを測定します。
-
実験が完了したら、になります
- パイプライン構成のランク付けされたリストパフォーマンスメトリックでソートされました。
- モジュールまたはパラメーターがデータに最適な結果をもたらす明確な洞察 Autoragから直接展開できるという自動化された最高のパイプライン
- 最高のragパイプラインの展開
- :パイプラインコンポーネント(レトリーバー、エンバダー、ジェネレーターモデルなど)を説明するYAMLファイルを生成します。
- Flask Serverで実行:既存のソフトウェアスタックと簡単に統合できるように、ローカルまたはクラウドベースのフラスコアプリで最高のパイプラインをホストします。
- gradio/huggingフェイススペース:あるいは、パイプラインの no fuss、インタラクティブなデモ>のグラデーションインターフェイスを備えたフェイススペースに展開します。
- なぜautorag?を使用するのか ここで、なぜautoragを試すべきなのか見てみましょう:
autoragに、複数のRAG構成を評価する重い持ち上げを処理させることにより。
一意のデータとニーズに合わせて最適化されたパイプラインでパフォーマンスを向上させます。
- シームレスな統合
- Quick DemosまたはProduction Deploymentsのために、フェイススペースを抱きしめるグレードを備えています。 オープンソース およびコミュニティ主導型であるため、正確な要件に合わせてカスタマイズまたは拡張できます。
- autoragはすでにGithubでトレンドを掲載しています。コミュニティに参加して、このツールがRAGワークフローにどのように革命をもたらすかを確認してください。 始めましょう
- githubでautoragをご覧ください: ソースコード、ドキュメント、コミュニティの例を調べてください。
- フェイススペースを抱き締めるautoragデモを試してください:グラデーションベースのデモを使用できます。ファイルをアップロードし、QAデータを作成し、さまざまなパイプライン構成を実験してください。
:オープンソースプロジェクトとして、AutoragはPRS、発行レポート、および機能の提案を歓迎します。
Autoragは、データの作成、パイプラインの実験、展開を自動化することにより、RAGシステムの構築から当て推量を削除します。データに最適なぼろきれの構成を見つけるための迅速で信頼できる方法が必要な場合は、Autoragをスピンして、結果を自分で話させてください。
autoragのステップバイステップウォークスルー- データ作成ワークフロー、共有したスクリーンショットが組み込まれています。このガイドは、PDFSを解析し、データをチャンクし、QAデータセットを生成し、さらにぼろぼろの実験のために準備するのに役立ちます。
ステップ1:OpenAI APIキーを入力
- autoragインターフェイスを開きます。
- 「Autorag Data作成」セクション(スクリーンショット#1)では、Openai APIキーを求めるプロンプトが表示されます。 テキストボックスにAPIキーを貼り付けて、Enterを押します。
- 入力したら、ステータスは「設定されていない」から「有効」(または類似)に変更され、キーが認識されていることを確認する必要があります。
- 注:AutORAGはAPIキーを保存またはログに記録しません。 右側からお好みの言語(英語、한국어、日本語)を選択することもできます。
ステップ2:PDFファイルを解析します
- ドロップダウンから解析方法を選択します。
- 一般的なオプションには、pdfminer、pdfplumber、およびpymupdf。
- が含まれます 各パーサーには長所と制限があるため、解析の問題に遭遇した場合は複数の方法をテストすることを検討してください。
- [解析](または同等のアクションボタン)をクリックします。 AutORAGはPDFを読み取り、単一のraw.Parquetファイルに変換します。 進行状況の更新については、テキストボックスを監視します。
- 解析が完了したら、[raw.parquetをダウンロード]をクリックして、結果をローカルまたはワークスペースに保存します。
- ヒント: raw.parquetファイルは、解析されたテキストデータです。必要に応じて寄木細工をサポートするツールで検査することができます。
をchunkします 「2」に移動します。 raw.parquet」(スクリーンショット#3)をchunkします。
前の手順を使用した場合、「以前のraw.parquetを使用」を選択してファイルを自動的に読み込むことができます。それ以外の場合は、[アップロード]をクリックして、自分の.Parquetファイルを持ち込みます。
チャンキング方法を選択してください:
- token :指定された数のトークンによるチャンク。
文:文の境界でテキストを分割します。
- セマンティック:セマンティックに類似したテキストへのチャンクへの埋め込みベースのアプローチを使用する可能性があります。 再帰
- :より多くの粒状セグメントのために複数のレベルでチャンクすることができます。 スライダー(例:256トークン)でチャンクサイズを設定し、オーバーラップ(32トークンなど)。オーバーラップは、塊の境界を越えてコンテキストを維持するのに役立ちます
- 「run chunking」をクリックします 確認またはステータスの更新については、 textbox
- をご覧ください。 完了後、「 corpus.parquetをダウンロード
- なぜチャンキング?
-
チャンキングは、検索方法が効率的に処理できる管理可能なピースにテキストを分割します。コンテキストと関連性のバランスをとるので、ぼろきシステムがトークンの制限を超えたり、トピックの焦点を希釈したりしないようにします。
ステップ4:corpus.parquetからQAデータセットを作成します 「3」。 corpus.parquetからQAデータセットを作成します。セクション(スクリーンショット#4)、corpus.parquetをアップロードまたは選択します。
QAメソッドを選択します:- デフォルト
- :Q&Aペアを生成するベースラインアプローチ。 fast
- :速度に優先順位を付け、おそらくより豊かな詳細を犠牲にしてコストを削減します。 Advanced :より徹底的でコンテキストが豊富なQ&Aペアを生成する可能性がありますが、より高価または遅くなる可能性があります。
- データ作成のモデルを選択します:
例のオプションには、GPT-4O-MINIまたはGPT-4O(インターフェイスが追加のモデルをリストする可能性があります)が含まれます。 選択されたモデルは、質問と回答の品質とスタイルを決定します。
- QAペアの数:
Openaiモデルへのバッチサイズ:
- デフォルトは16になります。つまり、バッチ要求ごとに16 Q&Aペアを意味します。レート制限エラーが表示されている場合は、下げます。
「qa creation
」をクリックします。テキストボックスにステータスの更新が表示されます。- ダウンロード
が完了した場合、 自動的に作成されたQ&Aデータセットを取得します。 コスト警告:Q&Aデータの生成は、使用料が発生するOpenai APIを呼び出します。大型バッチを実行する予定がある場合は、Openai請求ページで使用法を監視してください。
ステップ5:QAデータセットの使用 今:
corpus.parquet(あなたのチャンクされたドキュメントデータ)
qa.parquet(自動的に生成されたQ&Aペア)
これらをAutoragの評価と最適化ワークフローに送ることができます:
- 複数のRAG構成を評価
- - さまざまなレトリーバー、チャンクサイズ、埋め込みモデルをテストして、どの組み合わせがqa.parquetの質問に最もよく答えるかを確認します。
- 最適なパイプラインを識別するためのパフォーマンスメトリックをレビューしてください(正確な一致、F1、またはドメイン固有の基準)。
単一のYAML構成ファイルを介して最高のパイプライン - Autoragはフラスコサーバーまたはその他のエンドポイントをスピンアップできます。 -
ステップ6:データ作成Studio Waitlist(オプション)
に参加します自動的に生成されたQAデータセットをカスタマイズする場合(質問の編集、特定のトピックのフィルタリング、ドメイン固有のガイドラインの追加)Autoragはデータ作成スタジオを提供します。 「データ作成スタジオウェイトリストに参加する」をクリックして、インターフェイスにウェイトリストに直接サインアップしてください。
結論キーテイクアウト
- ユーザーは、データのニーズに合わせたカスタムデータセットを作成および評価できます。
- このツールは、単一のYAML構成で最高のパイプラインを展開することを簡素化します。 Autoragのオープンソースの自然は、コミュニティ主導の改善とカスタマイズを促進します
- よくある質問
- q1。 Autoragとは何ですか、そしてなぜそれが役立つのですか? Autoragは、構成実験を自動化することにより、検索された生成(RAG)パイプラインを最適化するためのオープンソースの自動車ツールです。なぜOpenAI APIキーを提供する必要があるのですか? AutoragはOpenAIモデルを使用して合成Q&Aペアを生成します。これは、RAGパイプラインのパフォーマンスを評価するために不可欠です。 raw.parquetファイルとは何ですか?また、どのように作成されますか? PDFSをアップロードすると、AutORAGはテキストを抽出して、効率的な処理のためにコンパクトな寄木細工ファイルに抽出します。解析されたテキストをチャンクする必要があるのはなぜですか、そしてcorpus.parquetとは?
- a。チャンキングは、大きなテキストファイルを小さく、取得可能なセグメントに分割します。出力はcorpus.parquetに保存され、ラグのパフォーマンスが向上します。私のPDFがパスワード保護またはスキャンされている場合はどうなりますか?暗号化または画像ベースのPDFは、AutORAGで使用する前に、パスワードの削除またはOCR処理が必要です。 Q&Aペアを生成するのにどれくらいの費用がかかりますか?コストは、コーパスサイズ、Q&Aペアの数、およびOpenaiモデルの選択に依存します。費用を見積もるために小さなバッチから始めます
この記事に示されているメディアは、Analytics Vidhyaが所有しておらず、著者の裁量で使用されています。
以上がAutORAG:オープンソースAutomlでRAGパイプラインを最適化しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

AIフィールドの評価メトリックとしての「バイブ」の使用の増加について説明しましょう。この分析は、AIの進歩に関する私の進行中のフォーブスコラムの一部であり、AI開発の複雑な側面を調査します(こちらのリンクを参照)。 AI評価のバイブ TRADI

Waymo's Arizona Factory:大量生産する自動運転ジャガー以上 アリゾナ州フェニックスの近くに位置するWaymoは、自律的なジャガーIペースの電気SUVの艦隊を生産する最先端の施設を運営しています。 この239,000平方フィートの工場がオープンしました

S&PグローバルのチーフデジタルソリューションオフィサーであるJigar Kocherlakotaは、同社のAIの旅、戦略的買収、将来に焦点を当てたデジタル変革について議論しています。 変革的なリーダーシップの役割と将来の準備ができています コチェルラコタの役割

アプリからエコシステムまで:デジタル景観のナビゲート デジタル革命は、ソーシャルメディアとAIをはるかに超えています。 私たちは、「すべてのアプリ」の台頭を目撃しています。 サムa

MasterCardのエージェント給与:AI搭載の支払いは、コマースに革命をもたらします VisaのAIを搭載したトランザクション機能は見出しになりましたが、MasterCardはトークン化、信頼、およびエージェントに基づいて構築されたより高度なAI-Native支払いシステムであるエージェントペイを発表しました。

Future Ventures Fund IV:新しいテクノロジーに200万ドルの賭け Future Venturesは最近、過度にサブスクライブされたファンドIVを閉鎖し、合計2億ドルです。 Steve Jurvetson、Maryanna Saenko、およびNico Enriquezが管理するこの新しい基金は、重要なInvを表しています

AIアプリケーションの爆発により、企業は従来の検索エンジン最適化(SEO)から生成エンジン最適化(GEO)に移行しています。 Googleがシフトをリードしています。その「AIの概要」機能は、10億人以上のユーザーにサービスを提供しており、ユーザーがリンクをクリックする前に完全な回答を提供しています。 [^2] 他の参加者も急速に上昇しています。 ChatGpt、Microsoft Copilot、Perplexityは、従来の検索結果を完全にバイパスする新しい「Answer Engine」カテゴリを作成しています。 これらのAIに生成された回答にビジネスが表示されない場合、従来の検索結果で高くランク付けされていても、潜在的な顧客は決してあなたを見つけることはありません。 SEOからGeoまで - これは正確に何を意味しますか? 何十年もの間

人工一般情報(AGI)への潜在的なパスを探りましょう。 この分析は、AIの進歩に関する私の進行中のフォーブスコラムの一部であり、AGIと人工的な緊急事態(ASI)を達成する複雑さを掘り下げています。 (関連するアートを参照してください


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

WebStorm Mac版
便利なJavaScript開発ツール

Safe Exam Browser
Safe Exam Browser は、オンライン試験を安全に受験するための安全なブラウザ環境です。このソフトウェアは、あらゆるコンピュータを安全なワークステーションに変えます。あらゆるユーティリティへのアクセスを制御し、学生が無許可のリソースを使用するのを防ぎます。

VSCode Windows 64 ビットのダウンロード
Microsoft によって発売された無料で強力な IDE エディター

ドリームウィーバー CS6
ビジュアル Web 開発ツール

DVWA
Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、
