今日は、Google Research とプリンストン大学の研究者が共同研究した論文「REACT: Combining Reasoning and Behavior in Language Models」を紹介します。彼らは、言語モデルにおける推論と動作を組み合わせる可能性を模索しながら、この論文を発表しました。大規模言語モデル (LLM) の推論機能とアクション機能は別々に研究されてきましたが、これら 2 つの機能が 1 つのシステムに統合されたのは今回が初めてです。したがって、この論文は非常に重要だと思います。 ReAct フレームワークを使用すると、仮想エージェントが Web データベースや SQL データベースへの接続などのさまざまなツールを使用できるようになり、推論とアクションに事実上無制限の拡張性が提供されます。タスク指向のアクションと次のステップに関する推論のシームレスな組み合わせ。この能力により、私たちは新しいタスクを迅速に学習し、信頼できる意思決定を下せるだけでなく、予期せぬ状況に適応することができます。 ReAct の目標は、言語モデルでこの相乗効果を再現し、推論ステップとタスク固有のアクションを交互に生成できるようにすることです
#ReAct の仕組み
#ReAct は、大規模な言語モデルに、特定のタスクに対する口頭推論の履歴ステップとアクションを生成するよう促します。これらのプロンプトは、モデルの思考とアクション生成をガイドする少数のコンテキスト例で構成されています。状況に応じた例を下の図に示します。これらの例は、アイデアを生成し、アクションを実行し、アクションの結果を観察するという循環プロセスを通じてエージェントをガイドします。 ReAct では、推論トレースとアクションを組み合わせることで、モデルが動的推論を実行できるようになり、高レベルの計画を生成したり、外部環境と対話して追加情報を収集したりできます
アプリケーションと結果
研究者らは、質問応答、事実検証、テキストベースのゲーム、Web ページなど、さまざまな言語推論や意思決定タスクに ReAct を適用しました。ナビゲーション。結果は傑出しており、ReAct は解釈可能性と信頼性の点で他の最先端のベースラインを常に上回っています
質問応答や事実確認タスクにおいて、ReAct はインタラクションを活用し、問題をうまく克服しています推論における一般的な幻覚と誤り伝播の問題。人間がタスクを解決する方法と同様のステップが生成され、推論の痕跡がないベースライン モデルよりも解釈が容易です。インタラクティブな意思決定ベンチマークでは、ReAct は、推論、アクション、観察のステップが絡み合っているにもかかわらず、1 つまたは 2 つのコンテキスト例
だけでも、模倣学習および強化学習手法を大幅に上回り、信頼性を向上させます。しかし、この構造は推論ステップの柔軟性も制限するため、一部のタスクでは思考連鎖プロンプトよりも推論エラー率が高くなります。
推論とアクションの重要性
研究者らは、さまざまなタスクにおける推論と行動の重要性を理解するために、アブレーション実験も実施しました。彼らは、ReAct の内部推論と外部動作を組み合わせると、推論やアクションのみに焦点を当てたベースラインよりも一貫してパフォーマンスが優れていることを発見しました。これは、より効果的な意思決定のために 2 つのプロセスを統合することの価値を強調しています
今後の方向性
ReAct は良好な結果を達成しましたが、まだ改善の余地があります。研究者らは、より多くのタスクをトレーニングおよび操作できるように ReAct をスケールアップし、強化学習などの補完的なパラダイムと組み合わせることを推奨しています。さらに、人間が注釈を付けたより多くのデータを使用してモデルを微調整して、パフォーマンスをさらに向上させることもできます。
#結論ReAct は、よりスマートな を開発しています。より一般的な AI システムに向けた大きな一歩であり、Langchain ライブラリの非常に便利なプロキシ関数もサポートしています。言語モデルで推論と動作を組み合わせることで、さまざまなタスクにわたってパフォーマンスの向上が実証されていると同時に、解釈可能性と信頼性も強化されています。人工知能が進化し続けるにつれて、推論と行動の統合は、より有能で適応性のある人工知能システムを作成する上で重要な役割を果たします
論文へのリンクを提供してください:
以上がよりスマートな AI の実現: 言語モデルで推論と動作を統合する ReAct テクノロジーの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

食品の準備を強化するAI まだ初期の使用中ですが、AIシステムは食品の準備にますます使用されています。 AI駆動型のロボットは、ハンバーガーの製造、SAの組み立てなど、食品の準備タスクを自動化するためにキッチンで使用されています

導入 Python関数における変数の名前空間、スコープ、および動作を理解することは、効率的に記述し、ランタイムエラーや例外を回避するために重要です。この記事では、さまざまなASPを掘り下げます

導入 鮮やかな絵画や彫刻に囲まれたアートギャラリーを歩くことを想像してください。さて、各ピースに質問をして意味のある答えを得ることができたらどうでしょうか?あなたは尋ねるかもしれません、「あなたはどんな話を言っていますか?

製品のケイデンスを継続して、今月MediaTekは、新しいKompanio UltraやDimenity 9400を含む一連の発表を行いました。これらの製品は、スマートフォン用のチップを含むMediaTekのビジネスのより伝統的な部分を埋めます

#1 GoogleはAgent2Agentを起動しました 物語:月曜日の朝です。 AI駆動のリクルーターとして、あなたはより賢く、難しくありません。携帯電話の会社のダッシュボードにログインします。それはあなたに3つの重要な役割が調達され、吟味され、予定されていることを伝えます

私はあなたがそうであるに違いないと思います。 私たちは皆、精神障害がさまざまな心理学の用語を混ぜ合わせ、しばしば理解できないか完全に無意味であることが多い、さまざまなおしゃべりで構成されていることを知っているようです。 FOを吐き出すために必要なことはすべてです

今週公開された新しい研究によると、2022年に製造されたプラスチックの9.5%のみがリサイクル材料から作られていました。一方、プラスチックは埋め立て地や生態系に積み上げられ続けています。 しかし、助けが近づいています。エンジンのチーム

主要なエンタープライズ分析プラットフォームAlteryxのCEOであるAndy Macmillanとの私の最近の会話は、AI革命におけるこの重要でありながら過小評価されている役割を強調しました。 MacMillanが説明するように、生のビジネスデータとAI-Ready情報のギャップ


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

MinGW - Minimalist GNU for Windows
このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポート ライブラリとヘッダー ファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。

WebStorm Mac版
便利なJavaScript開発ツール

SecLists
SecLists は、セキュリティ テスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティ テスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティ テストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジング ペイロード、機密データ パターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテスト マシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。

Dreamweaver Mac版
ビジュアル Web 開発ツール

Safe Exam Browser
Safe Exam Browser は、オンライン試験を安全に受験するための安全なブラウザ環境です。このソフトウェアは、あらゆるコンピュータを安全なワークステーションに変えます。あらゆるユーティリティへのアクセスを制御し、学生が無許可のリソースを使用するのを防ぎます。
