検索
ホームページテクノロジー周辺機器AIGPT は頭脳として機能し、複数のモデルが連携してさまざまなタスクを完了するように指示します。一般的なシステム AutoML-GPT はここにあります。

現在、AI モデルは非常に幅広い応用分野に関与していますが、ほとんどの AI モデルは特定のタスク向けに設計されており、正しいモデル アーキテクチャ、最適化アルゴリズム、およびハイパーパラメータ。 ChatGPT と GPT-4 が普及した後、人々はテキストの理解、生成、対話、推論などにおける大規模言語モデル (LLM) の大きな可能性を認識しました。研究者の中には、LLM を使用して汎用人工知能 (AGI) への新しい道を探ろうとする人もいます。

最近、テキサス大学オースティン校の研究者らは、タスク指向のプロンプトを開発し、LLM を使用してトレーニング パイプラインを自動化するという新しいアイデアを提案しました。このアイデアに基づいて、新しいアイデアを立ち上げました。システム AutoML-GPT。

GPT は頭脳として機能し、複数のモデルが連携してさまざまなタスクを完了するように指示します。一般的なシステム AutoML-GPT はここにあります。

紙のアドレス:

https: //www.php.cn/link/39d4b545fb02556829aab1db805021c3

AutoML-GPT は、GPT をさまざまな AI モデル間のブリッジとして使用し、最適化されたハイパーパラメーターを使用してモデルを動的にトレーニングします。 AutoML-GPT は、Model Card [Mitchell et al., 2019] および Data Card [Gebru et al., 2021] からユーザーリクエストを動的に受け取り、対応するプロンプト段落を構成します。最後に、AutoML-GPT はこのプロンプト段落を使用して、データの処理、モデル アーキテクチャの構築、ハイパーパラメーターの調整、トレーニング ログの予測などの複数の実験を自動的に実行します。

AutoML-GPT は、強力な NLP 機能と既存の AI モデルを最大限に活用することで、さまざまなテストやデータセットにわたる複雑な AI タスクを解決します。多数の実験とアブレーション研究により、AutoML-GPT が多くの人工知能タスク (CV タスクや NLP タスクを含む) に対して多用途で効果的であることが示されています。

AutoML-GPT の概要

AutoML-GPT は、データとモデル情報に依存してプロンプト入力段落をフォーマットする共同システムです。このうち、LLM がコントローラーとして機能し、複数のエキスパート モデルが協調的な実行者として機能します。 AutoML-GPT のワークフローには、データ処理、モデル アーキテクチャ設計、ハイパーパラメータ調整、トレーニング ログ生成の 4 つの段階が含まれます。

具体的には、AutoML-GPT の動作メカニズムは次のとおりです。モデル カードとデータ カードは、固定形式のプロンプト段落を生成します

#選択したデータ セットとモデル アーキテクチャに関するユーザーのニーズに対応するトレーニング パイプラインを構築しますGPT は頭脳として機能し、複数のモデルが連携してさまざまなタスクを完了するように指示します。一般的なシステム AutoML-GPT はここにあります。

    #パフォーマンス トレーニング ログを生成し、ハイパーパラメータを調整します
  • #自動提案されたハイパーパラメータに基づいてモデルを調整します
  • 入力分解
  • AutoML-GPT の最初の段階は、LLM がユーザー入力を受け入れることです。 LLM のパフォーマンスを向上させ、効果的なプロンプトを生成するために、この研究では入力プロンプトに特定の命令を採用しました。これらの手順には、データ カード、モデル カード、評価メトリック、および追加要件の 3 つの部分が含まれています。
以下の図 2 に示すように、データ カードの主要な部分は、データ セット名、入力データ セット タイプ (画像データやテキスト データなど)、ラベル スペース (カテゴリや解像度など)とデフォルトの評価指標。

以下の図 3 に示すように、モデル カードは、モデル名、モデル構造、モデルの説明、およびアーキテクチャのハイパーパラメーターで構成されます。この情報を提供することにより、モデル カードは、機械学習システム全体でどのモデルが使用されているか、およびモデル アーキテクチャに対するユーザーの好みを LLM に伝えることができます。

データ カードとモデル カードに加えて、ユーザーは、より多くの評価ベンチマーク、評価指標、または制約をリクエストすることもできます。 AutoML-GPT は、これらのタスク仕様を高レベルの指示として LLM に提供し、それに応じてユーザー要件を分析します。

処理する必要のある一連のタスクがある場合、AutoML-GPT は各タスクに対応するモデルを照合する必要があります。この目標を達成するには、システムはまずモデル カードとユーザー入力からモデルの説明を取得する必要があります。

AutoML-GPT は、コンテキスト内のタスク モデル割り当てメカニズムを使用して、モデルをタスクに動的に割り当てます。このアプローチにより、増分モデルへのアクセスが可能になり、モデルの説明とユーザーのニーズのより深い理解とを組み合わせることで、より優れたオープン性と柔軟性が提供されます。

予測トレーニング ログを使用してハイパーパラメータを調整する

AutoML-GPT は、データ カードとモデル カードに基づいてハイパーパラメータを設定します。ハイパーパラメータのトレーニング ログを生成することでパフォーマンスを予測します。システムは自動的にトレーニングを実行し、トレーニング ログを返します。データセット上のモデル パフォーマンス トレーニング ログには、トレーニング プロセス中に収集されたさまざまなメトリクスと情報が記録されます。これは、モデル トレーニングの進行状況を理解し、潜在的な問題を特定し、選択したアーキテクチャ、ハイパーパラメーター、最適化手法の有効性を評価するのに役立ちます。

実験

AutoML-GPT のパフォーマンスを評価するために、この研究では ChatGPT (OpenAI の GPT-4 バージョン) を使用して実装し、複数の観点から複数の実験を実施します。 AutoML-GPT の効果を示します。

# 以下の図 4 は、AutoML-GPT を使用した未知のデータセットでのトレーニングの結果を示しています。

GPT は頭脳として機能し、複数のモデルが連携してさまざまなタスクを完了するように指示します。一般的なシステム AutoML-GPT はここにあります。

下の図 5 は、AutoML-GPT が COCO データ セットでターゲット検出タスクを完了するプロセスを示しています。

GPT は頭脳として機能し、複数のモデルが連携してさまざまなタスクを完了するように指示します。一般的なシステム AutoML-GPT はここにあります。

#下の図 6 は、AutoML-GPT を示しています。 NQ オープン データセット (Natural question Open データセット、[Kwiatkowski et al., 2019]) の実験結果:

GPT は頭脳として機能し、複数のモデルが連携してさまざまなタスクを完了するように指示します。一般的なシステム AutoML-GPT はここにあります。

この研究では、評価された XGBoost も使用されました。 UCI Adult データセットに対する AutoML-GPT [Dua and Graff, 2017] を使用して、分類タスクでのパフォーマンスを調査しました。実験結果は、以下の図 7 に示されています。 ##興味のある読者は、論文の原文を読んで研究の詳細を学ぶことができます。

以上がGPT は頭脳として機能し、複数のモデルが連携してさまざまなタスクを完了するように指示します。一般的なシステム AutoML-GPT はここにあります。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。
ほとんどが使用されています10 Power BIチャート - 分析Vidhyaほとんどが使用されています10 Power BIチャート - 分析VidhyaApr 16, 2025 pm 12:05 PM

Microsoft PowerBIチャートでデータ視覚化の力を活用する 今日のデータ駆動型の世界では、複雑な情報を非技術的な視聴者に効果的に伝えることが重要です。 データの視覚化は、このギャップを橋渡しし、生データを変換するi

AIのエキスパートシステムAIのエキスパートシステムApr 16, 2025 pm 12:00 PM

エキスパートシステム:AIの意思決定力に深く飛び込みます 医療診断から財務計画まで、あらゆることに関する専門家のアドバイスにアクセスできることを想像してください。 それが人工知能の専門家システムの力です。 これらのシステムはプロを模倣します

3人の最高の雰囲気コーダーがこのAI革命をコードで分解する3人の最高の雰囲気コーダーがこのAI革命をコードで分解するApr 16, 2025 am 11:58 AM

まず第一に、これがすぐに起こっていることは明らかです。さまざまな企業が、現在AIによって書かれているコードの割合について話しており、これらは迅速なクリップで増加しています。すでに多くの仕事の移動があります

滑走路AIのGen-4:AIモンタージュはどのように不条理を超えることができますか滑走路AIのGen-4:AIモンタージュはどのように不条理を超えることができますかApr 16, 2025 am 11:45 AM

映画業界は、デジタルマーケティングからソーシャルメディアまで、すべてのクリエイティブセクターとともに、技術的な岐路に立っています。人工知能が視覚的なストーリーテリングのあらゆる側面を再構築し始め、エンターテイメントの風景を変え始めたとき

5日間のISRO AI無料コースを登録する方法は? - 分析Vidhya5日間のISRO AI無料コースを登録する方法は? - 分析VidhyaApr 16, 2025 am 11:43 AM

ISROの無料AI/MLオンラインコース:地理空間技術の革新へのゲートウェイ インド宇宙研究機関(ISRO)は、インドのリモートセンシング研究所(IIRS)を通じて、学生と専門家に素晴らしい機会を提供しています。

AIのローカル検索アルゴリズムAIのローカル検索アルゴリズムApr 16, 2025 am 11:40 AM

ローカル検索アルゴリズム:包括的なガイド 大規模なイベントを計画するには、効率的なワークロード分布が必要です。 従来のアプローチが失敗すると、ローカル検索アルゴリズムは強力なソリューションを提供します。 この記事では、Hill ClimbingとSimulについて説明します

OpenaiはGPT-4.1でフォーカスをシフトし、コーディングとコスト効率を優先しますOpenaiはGPT-4.1でフォーカスをシフトし、コーディングとコスト効率を優先しますApr 16, 2025 am 11:37 AM

このリリースには、GPT-4.1、GPT-4.1 MINI、およびGPT-4.1 NANOの3つの異なるモデルが含まれており、大規模な言語モデルのランドスケープ内のタスク固有の最適化への動きを示しています。これらのモデルは、ようなユーザー向けインターフェイスをすぐに置き換えません

プロンプト:ChatGptは偽のパスポートを生成しますプロンプト:ChatGptは偽のパスポートを生成しますApr 16, 2025 am 11:35 AM

Chip Giant Nvidiaは、月曜日に、AI Supercomputersの製造を開始すると述べました。これは、大量のデータを処理して複雑なアルゴリズムを実行できるマシンを初めて初めて米国内で実行します。発表は、トランプSI大統領の後に行われます

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

SublimeText3 Linux 新バージョン

SublimeText3 Linux 新バージョン

SublimeText3 Linux 最新バージョン

DVWA

DVWA

Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、

VSCode Windows 64 ビットのダウンロード

VSCode Windows 64 ビットのダウンロード

Microsoft によって発売された無料で強力な IDE エディター

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポート ライブラリとヘッダー ファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。