AutORAG：オープンソースAutomlでRAGパイプラインを最適化します-AI-php.cn

ホームページ

テクノロジー周辺機器

AutORAG：オープンソースAutomlでRAGパイプラインを最適化します

William Shakespeare

Mar 07, 2025 am 09:09 AM

ここ数か月で、検索された世代（RAG）は、大規模な言語モデルと外部の知識を組み合わせるための強力な手法として人気が急上昇しています。ただし、適切なRAGパイプライン（インデックス化、埋め込みモデル、チャンキング方法、質問回答アプローチ）を選択することは困難です。数え切れないほどの構成があれば、どのパイプラインがデータとユースケースに最適であるかを確認するにはどうすればよいですか？それがAutoragが入ってくる場所です

学習目標

データのさまざまなRAG構成をautoragがどのように体系的に評価するかを学びます。
データ作成、パイプライン実験、展開など、Autoragの主要な機能を探索します。
AutORAGの自動化されたワークフローを使用して、最高のパフォーマンスのあるRAGパイプラインを展開する方法を発見してください。
この記事は、

データサイエンスブログの一部として公開されました。目次autoragとは何ですか？autoragがラグパイプラインを最適化する方法autorag

結論

autoragとは？
Autoragは、ぼろきれに焦点を当てたオープンソースの自動機械学習（Automl）ツールです。独自のデータセット上のさまざまなRAGパイプラインコンポーネントを体系的にテストおよび評価して、ユースケースに最適な構成を決定します。実験を自動的に実行する（およびデータ作成、チャンキング、QAデータセット生成、パイプラインの展開などのタスクを処理することで、Autoragは時間と手間を節約します。
なぜautorag？
- 多数のRAGパイプラインとモジュール：RAGシステムを構成する多くの可能な方法があります。
- 時間のかかる実験：すべてのパイプラインを自分のデータで手動でテストするのは面倒です。ほとんどの人は決してそれをしません。つまり、パフォーマンスの向上や推論を逃している可能性があります。データとユースケースに合わせて調整された
- キー機能
データ作成
：Autoragでは、独自の生文書、PDFファイル、またはその他のテキストソースからRAG評価データを作成できます。ファイルをアップロードして、raw.parquetに解析し、それらをcorpus.parquetにchunkし、qaデータセットを自動的に生成します。
- 最適化：Autoragは、データに最適なラグパイプラインを発見するために、実行中の実験（ハイパーパラメーターチューニング、パイプライン選択など）を自動化します。 QAデータセットに対する精度、関連性、事実上の正確性などのメトリックを測定して、最高のパフォーマンスのセットアップを特定します。
- ：最高のパイプラインを特定したら、Autoragは展開を簡単にします。単一のYAML構成では、最適なパイプラインをフラスコサーバーまたは選択した別の環境に展開できます。顔のスペースを抱きしめてグラデーションで構築されています
- Autoragのユーザーフレンドリーなインターフェイスは、Gradioを使用して構築されており、フェイススペースを抱き締めるのは簡単です。インタラクティブなGUIは、これらの実験を実行するために深い技術的専門知識を必要としないことを意味します。データをアップロードし、パラメーターを選択し、結果を生成する手順に従ってください。 autoragがragパイプラインを最適化する方法
を使用できます

複数のレトリバータイプ
（例えば、ベクトルベース、キーワード、ハイブリッド）をテストします。

さまざまなチャンクサイズを探索し、戦略をオーバーラップします。
- 埋め込みモデルを評価（たとえば、Openai Embeddings、Hugging Face Transformers）。
- プロンプトテンプレートを調整最も正確または関連する回答を生成するかを確認します。
- 実験が完了したら、になります
  - パイプライン構成のランク付けされたリストパフォーマンスメトリックでソートされました。
  - モジュールまたはパラメーターがデータに最適な結果をもたらす明確な洞察
  - 最高のragパイプラインの展開
  ライブの準備ができたら、autoragは展開を合理化します：
  
  シングルYAML構成
  - Flask Serverで実行：既存のソフトウェアスタックと簡単に統合できるように、ローカルまたはクラウドベースのフラスコアプリで最高のパイプラインをホストします。
  - gradio/huggingフェイススペース：あるいは、パイプラインの no fuss、インタラクティブなデモ>のグラデーションインターフェイスを備えたフェイススペースに展開します。
  - なぜautorag？を使用するのか ここで、なぜautoragを試すべきなのか見てみましょう：
  時間を節約
  autoragに、複数のRAG構成を評価する重い持ち上げを処理させることにより。
  
  一意のデータとニーズに合わせて最適化されたパイプラインでパフォーマンスを向上させます。
  - Quick DemosまたはProduction Deploymentsのために、フェイススペースを抱きしめるグレードを備えています。オープンソース
  - autoragはすでにGithubでトレンドを掲載しています。コミュニティに参加して、このツールがRAGワークフローにどのように革命をもたらすかを確認してください。始めましょう
  - githubでautoragをご覧ください：
  - フェイススペースを抱き締めるautoragデモを試してください：グラデーションベースのデモを使用できます。ファイルをアップロードし、QAデータを作成し、さまざまなパイプライン構成を実験してください。
  貢献
  ：オープンソースプロジェクトとして、AutoragはPRS、発行レポート、および機能の提案を歓迎します。
  
  Autoragは、データの作成、パイプラインの実験、展開を自動化することにより、RAGシステムの構築から当て推量を削除します。データに最適なぼろきれの構成を見つけるための迅速で信頼できる方法が必要な場合は、Autoragをスピンして、結果を自分で話させてください。
  autoragのステップバイステップウォークスルー
  - データ作成ワークフロー、共有したスクリーンショットが組み込まれています。このガイドは、PDFSを解析し、データをチャンクし、QAデータセットを生成し、さらにぼろぼろの実験のために準備するのに役立ちます。
    ステップ1：OpenAI APIキーを入力
    - autoragインターフェイスを開きます。
    - 「Autorag Data作成」セクション（スクリーンショット＃1）では、Openai APIキーを求めるプロンプトが表示されます。
    - 入力したら、ステータスは「設定されていない」から「有効」（または類似）に変更され、キーが認識されていることを確認する必要があります。
    - 注：AutORAGはAPIキーを保存またはログに記録しません。
    ステップ2：PDFファイルを解析します
    
    下にスクロールして、「1.PDFファイルのパース」（スクリーンショット＃2）。
    
    [ファイルのアップロード]をクリックして、コンピューターから1つ以上のPDFドキュメントを選択します。例のスクリーンショットには、66EB856E019Eという名前の2.1 MB PDFファイルが表示されます。
    - が含まれます
    - [解析]（または同等のアクションボタン）をクリックします。 AutORAGはPDFを読み取り、単一のraw.Parquetファイルに変換します。
    - ヒント：
    ステップ3：raw.parquet
    をchunkします「2」に移動します。 raw.parquet」（スクリーンショット＃3）をchunkします。
    
    前の手順を使用した場合、「以前のraw.parquetを使用」を選択してファイルを自動的に読み込むことができます。それ以外の場合は、[アップロード]をクリックして、自分の.Parquetファイルを持ち込みます。
    
    チャンキング方法を選択してください：
    - token
    文：文の境界でテキストを分割します。
    - セマンティック：セマンティックに類似したテキストへのチャンクへの埋め込みベースのアプローチを使用する可能性があります。
    - ：より多くの粒状セグメントのために複数のレベルでチャンクすることができます。スライダー（例：256トークン）でチャンクサイズを設定し、オーバーラップ（32トークンなど）。オーバーラップは、塊の境界を越えてコンテキストを維持するのに役立ちます
    - 「run chunking」をクリックします確認またはステータスの更新については、
    - をご覧ください。完了後、「
    」を取得して、新しく充電したデータセットを取得します。
    - チャンキングは、検索方法が効率的に処理できる管理可能なピースにテキストを分割します。コンテキストと関連性のバランスをとるので、ぼろきシステムがトークンの制限を超えたり、トピックの焦点を希釈したりしないようにします。
      
      ステップ4：corpus.parquet
      からQAデータセットを作成します「3」。 corpus.parquetからQAデータセットを作成します。セクション（スクリーンショット＃4）、corpus.parquetをアップロードまたは選択します。
      
      QAメソッドを選択します：
      - ：Q＆Aペアを生成するベースラインアプローチ。
      - ：速度に優先順位を付け、おそらくより豊かな詳細を犠牲にしてコストを削減します。 Advanced
      - データ作成のモデルを選択します：
      例のオプションには、GPT-4O-MINIまたはGPT-4O（インターフェイスが追加のモデルをリストする可能性があります）が含まれます。 選択されたモデルは、質問と回答の品質とスタイルを決定します。
      - QAペアの数：
      スライダーは通常20から150になります。最初の実行では、コストを制限するために小さくして（20または30）に保ちます。
      Openaiモデルへのバッチサイズ：
      「qa creation
      」をクリックします。テキストボックスにステータスの更新が表示されます。
      qa.parquet
      自動的に作成されたQ＆Aデータセットを取得します。コスト警告：Q＆Aデータの生成は、使用料が発生するOpenai APIを呼び出します。大型バッチを実行する予定がある場合は、Openai請求ページで使用法を監視してください。
      
      ステップ5：QAデータセットの使用 今：
      
      corpus.parquet（あなたのチャンクされたドキュメントデータ）
      
      qa.parquet（自動的に生成されたQ＆Aペア）
      
      これらをAutoragの評価と最適化ワークフローに送ることができます：
      - - さまざまなレトリーバー、チャンクサイズ、埋め込みモデルをテストして、どの組み合わせがqa.parquetの質問に最もよく答えるかを確認します。
      - 最適なパイプラインを識別するためのパフォーマンスメトリックをレビューしてください（正確な一致、F1、またはドメイン固有の基準）。
      デプロイ
      単一のYAML構成ファイルを介して最高のパイプライン - Autoragはフラスコサーバーまたはその他のエンドポイントをスピンアップできます。
      
      ステップ6：データ作成Studio Waitlist（オプション）
      に参加します
      自動的に生成されたQAデータセットをカスタマイズする場合（質問の編集、特定のトピックのフィルタリング、ドメイン固有のガイドラインの追加）Autoragはデータ作成スタジオを提供します。「データ作成スタジオウェイトリストに参加する」をクリックして、インターフェイスにウェイトリストに直接サインアップしてください。
      結論
      
      Autoragは、検索された生成（RAG）パイプラインを最適化するための合理化された自動化されたアプローチを提供し、特定のデータセットに合わせたさまざまな構成をテストすることにより、貴重な時間と労力を節約します。データの作成、チャンキング、QAデータセット生成、およびパイプラインの展開を簡素化することにより、AutORAGは、ユースケースの最も効果的なRAGセットアップをすばやく特定できるようにします。 OpenAIのモデルとのユーザーフレンドリーなインターフェイスと統合により、AutORAGは初心者と経験豊富なユーザーの両方に、RAGシステムのパフォーマンスを効率的に改善するための信頼できるツールを提供します。
      キーテイクアウト
      
      autoragは、パフォーマンスを向上させるためにラグパイプラインを最適化するプロセスを自動化します。
      ユーザーは、データのニーズに合わせたカスタムデータセットを作成および評価できます。
      このツールは、単一のYAML構成で最高のパイプラインを展開することを簡素化します。
      Autoragのオープンソースの自然は、コミュニティ主導の改善とカスタマイズを促進します
      
      よくある質問
      
      q1。 Autoragとは何ですか、そしてなぜそれが役立つのですか？ Autoragは、構成実験を自動化することにより、検索された生成（RAG）パイプラインを最適化するためのオープンソースの自動車ツールです。なぜOpenAI APIキーを提供する必要があるのですか？ AutoragはOpenAIモデルを使用して合成Q＆Aペアを生成します。これは、RAGパイプラインのパフォーマンスを評価するために不可欠です。 raw.parquetファイルとは何ですか？また、どのように作成されますか？ PDFSをアップロードすると、AutORAGはテキストを抽出して、効率的な処理のためにコンパクトな寄木細工ファイルに抽出します。解析されたテキストをチャンクする必要があるのはなぜですか、そしてcorpus.parquetとは？
      a。チャンキングは、大きなテキストファイルを小さく、取得可能なセグメントに分割します。出力はcorpus.parquetに保存され、ラグのパフォーマンスが向上します。私のPDFがパスワード保護またはスキャンされている場合はどうなりますか？暗号化または画像ベースのPDFは、AutORAGで使用する前に、パスワードの削除またはOCR処理が必要です。 Q＆Aペアを生成するのにどれくらいの費用がかかりますか？コストは、コーパスサイズ、Q＆Aペアの数、およびOpenaiモデルの選択に依存します。費用を見積もるために小さなバッチから始めます
      
      この記事に示されているメディアは、Analytics Vidhyaが所有しておらず、著者の裁量で使用されています。

以上がAutORAG：オープンソースAutomlでRAGパイプラインを最適化しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

サム・アルトマンなどが現在、AIの最新の進捗のための新しいゲージとしてバイブを使用している理由

AIフィールドの評価メトリックとしての「バイブ」の使用の増加について説明しましょう。この分析は、AIの進歩に関する私の進行中のフォーブスコラムの一部であり、AI開発の複雑な側面を調査します（こちらのリンクを参照）。 AI評価のバイブ TRADI

Robotaxiの未来を建設するWaymo工場内May 06, 2025 am 11:11 AM

Waymo's Arizona Factory：大量生産する自動運転ジャガー以上アリゾナ州フェニックスの近くに位置するWaymoは、自律的なジャガーIペースの電気SUVの艦隊を生産する最先端の施設を運営しています。この239,000平方フィートの工場がオープンしました

内部S＆PグローバルのコアでAIを使用したデータ駆動型変換May 06, 2025 am 11:10 AM

S＆PグローバルのチーフデジタルソリューションオフィサーであるJigar Kocherlakotaは、同社のAIの旅、戦略的買収、将来に焦点を当てたデジタル変革について議論しています。変革的なリーダーシップの役割と将来の準備ができていますコチェルラコタの役割

スーパーアプリの台頭：デジタルエコシステムで繁栄する4つのステップMay 06, 2025 am 11:09 AM

アプリからエコシステムまで：デジタル景観のナビゲートデジタル革命は、ソーシャルメディアとAIをはるかに超えています。私たちは、「すべてのアプリ」の台頭を目撃しています。サムa

MasterCardとVisaはAIエージェントを解き放ち、あなたのために買い物をしますMay 06, 2025 am 11:08 AM

MasterCardのエージェント給与：AI搭載の支払いは、コマースに革命をもたらします VisaのAIを搭載したトランザクション機能は見出しになりましたが、MasterCardはトークン化、信頼、およびエージェントに基づいて構築されたより高度なAI-Native支払いシステムであるエージェントペイを発表しました。

Bocking the Bold：Future VenturesのTransformative Innovation PlaybookMay 06, 2025 am 11:07 AM

Future Ventures Fund IV：新しいテクノロジーに200万ドルの賭け Future Venturesは最近、過度にサブスクライブされたファンドIVを閉鎖し、合計2億ドルです。 Steve Jurvetson、Maryanna Saenko、およびNico Enriquezが管理するこの新しい基金は、重要なInvを表しています

AIが急上昇すると、企業はSEOからGEOに移行しますMay 05, 2025 am 11:09 AM

AIアプリケーションの爆発により、企業は従来の検索エンジン最適化（SEO）から生成エンジン最適化（GEO）に移行しています。 Googleがシフトをリードしています。その「AIの概要」機能は、10億人以上のユーザーにサービスを提供しており、ユーザーがリンクをクリックする前に完全な回答を提供しています。 [^2] 他の参加者も急速に上昇しています。 ChatGpt、Microsoft Copilot、Perplexityは、従来の検索結果を完全にバイパスする新しい「Answer Engine」カテゴリを作成しています。これらのAIに生成された回答にビジネスが表示されない場合、従来の検索結果で高くランク付けされていても、潜在的な顧客は決してあなたを見つけることはありません。 SEOからGeoまで - これは正確に何を意味しますか？何十年もの間

これらの経路のどれが今日のAIをプッシュして賞賛されるAGIになることについての大きな賭けMay 05, 2025 am 11:08 AM

人工一般情報（AGI）への潜在的なパスを探りましょう。この分析は、AIの進歩に関する私の進行中のフォーブスコラムの一部であり、AGIと人工的な緊急事態（ASI）を達成する複雑さを掘り下げています。（関連するアートを参照してください

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

WebStorm Mac版

便利なJavaScript開発ツール

Safe Exam Browser

Safe Exam Browser は、オンライン試験を安全に受験するための安全なブラウザ環境です。このソフトウェアは、あらゆるコンピュータを安全なワークステーションに変えます。あらゆるユーティリティへのアクセスを制御し、学生が無許可のリソースを使用するのを防ぎます。

VSCode Windows 64 ビットのダウンロード

Microsoft によって発売された無料で強力な IDE エディター

ドリームウィーバー CS6

ビジュアル Web 開発ツール

DVWA

Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、