検索
ホームページテクノロジー周辺機器AI新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来


  • 論文リンク: https://browse.arxiv.org/pdf/2211.13976.pdf
  • GitHub: https://github.com/Vanint/DatasetExpansion
ご存知のとおり、ディープ ニューラル ネットワークのパフォーマンスはトレーニング データに大きく依存します。量と質のせいで、ディープ ラーニングを小規模なデータ タスクに広く適用することが困難になります。たとえば、医療やその他の分野での小規模データのアプリケーション シナリオでは、大規模なデータ セットを手動で収集してラベル付けするのは、多くの場合、時間と労力がかかります。このデータ不足の問題に対処し、データ収集コストを最小限に抑えるために、この論文では、新しいデータを自動的に生成して、ターゲット タスクの小さなデータ セットをより大きく、より情報量の多いデータ セットに拡張することを目的とした、データ セット拡張の新しいパラダイムを検討します。セット。これらの拡張データセットは、モデルのパフォーマンスと汎化機能の向上に特化しており、さまざまなネットワーク構造のトレーニングに使用できます

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来

この成果は、既存の方法を使用するだけではデータセットを十分に拡張できないということです。 (1) ランダム データ強化は主に画像の表面の視覚特性を変更しますが、新しいオブジェクトの内容を含む画像を作成することはできません (下の画像の蓮は同じであり、新しい蓮は生成されません)。そのため、導入される情報量は限定。さらに深刻なのは、ランダムなデータ強調により、医用画像の病変(変化)位置が切り取られる可能性があり、その結果、サンプルの重要な情報が減少し、さらにはノイズの多いデータが生成される可能性があることです。 (2) データセットの増幅に事前トレーニング済みの生成 (拡散) モデルを直接使用しても、ターゲット タスクでのモデルのパフォーマンスを十分に向上させることはできません。これは、これらの生成モデルの事前トレーニング データには、ターゲット データとの大きな分布の差があることが多く、その結果、生成されるデータとターゲット タスクの間に一定の分布とカテゴリのギャップが生じ、生成されたデータがターゲット タスクと一致することを保証することが不可能であるためです。サンプルには正しいカテゴリとラベルがあり、モデルのトレーニングに役立ちます。

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来

#より効率的なデータセットの拡張を実現するために、研究者は人間の連合学習を研究してきました。人間は、ある物体についての事前知識があれば、下の写真のさまざまな種類、色、形、背景の犬のバリエーションなど、その物体のさまざまなバリエーションを容易に想像できます。この想像力豊かな学習プロセスは、画像内の動物の外観を単に混乱させるだけでなく、豊富な事前知識を適用して新しい情報を含むさまざまな画像を作成するため、データセットの増幅にとって非常に有益です。

しかし、データ想像力のためのアプリオリなモデルとして人間を直接モデル化することはできません。幸いなことに、最近の生成モデル (安定拡散、DALL-E2 など) は、大規模なデータセットの分布に適合する強力な機能を実証しており、リッチでリアルな画像を生成できます。このことから、この論文では、事前にトレーニングされた生成モデルを事前モデルとして使用し、その強力な事前知識を活用して、小規模なデータセットに対して効率的なデータの関連付けと増幅を実行するようになりました。

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来

上記のアイデアに基づいて、この研究は新しい Guided Imagination Framework (GIF) を提案します。この方法により、自然画像や医療画像のタスクに対するディープ ニューラル ネットワークの分類パフォーマンスと汎化能力が効果的に向上し、手動によるデータ収集と注釈付けによって生じる膨大なコストが大幅に削減されます。同時に、拡張されたデータセットはモデルの転移学習を促進し、ロングテール問題を軽減するのにも役立ちます。

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来

次に、このデータセット増幅の新しいパラダイムがどのように設計されているかを見てみましょう。

方法

データセット増幅の課題と指針となる標準 データセット増幅を設計するには 2 つの方法があります。課題: (1) 生成されたサンプルに正しいカテゴリ ラベルを付けるにはどうすればよいでしょうか? (2) 生成されたサンプルにモデルのトレーニングを促進するための新しい情報が含まれていることを確認するにはどうすればよいですか?これら 2 つの課題に対処するために、この研究では広範な実験を通じて 2 つの増幅指針基準、(1) カテゴリ一貫した情報の強化、(2) サンプルの多様性の向上を発見しました。

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来

方法論的フレームワーク 発見された増幅指針基準に基づいて、この研究は、誘導された想像力の増幅フレームワークを提案します。 (GIF)。各入力シード サンプル x に対して、GIF は最初に前の生成モデルの特徴抽出器を使用してサンプル特徴 f を抽出し、特徴に対してノイズ摂動を実行します: 新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来。ノイズ (z、b) を設定する最も簡単な方法は、ガウス ランダム ノイズを使用することですが、生成されたサンプルに正しいクラス ラベルが付けられ、より多くの情報がもたらされることを保証できません。したがって、効率的なデータセット増幅のために、GIF は発見された増幅ガイドライン、つまり 新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来 に基づいてノイズ摂動を最適化します。

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来


#使用される増幅ガイダンス標準は次のように実装されます。クラス一貫性のある情報量インデックス: 新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来; サンプル多様性インデックス: 新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来。これら 2 つの指標を最大化することで、GIF はノイズ摂動を効果的に最適化し、それによってカテゴリの一貫性を維持し、より多くの情報コンテンツをもたらすサンプルを生成できます。

実験

増幅効果 GIF はより強い増幅効果を持っています: GIF-SD は、 6 つの自然データセットでは分類精度が平均 36.9% 向上し、3 つの医療データセットでは分類精度が平均 13.5% 向上しました。

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来

増幅効率 GIF はより強い増幅効率を持っています: 車と DTD データセットでは、 GIF-SD を使用した 5 倍増幅の効果は、ランダム データ拡張を使用した 20 倍増幅の効果をも上回ります。

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来

#可視化結果 既存のデータ拡張手法では新しい画像コンテンツを生成できませんが、GIF の方がより適切に生成できます。新しいコンテンツを含むサンプル。

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来

既存の強調方法では、医療画像内の病変の位置がカットされる可能性があり、その結果、サンプル情報とノイズが減少しますが、GIF はより適切に保存されます。セマンティクス

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来

計算コストと時間コスト 手動によるデータ収集と注釈と比較して、GIF は大幅にコストを削減できます。データセットの増強にかかる時間とコスト。

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来

増幅されたデータの汎用性 これらのデータセットは、増幅されると、さまざまなニューラル ネットワーク モデルのトレーニングに直接使用できます。構造。

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来

#モデルの汎化能力の向上 GIF は、モデルの分布外汎化パフォーマンスの向上に役立ちます(OOD の一般化)。

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来

#ロングテール問題の軽減 GIF はロングテール問題の軽減に役立ちます。

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来

#安全性チェック

GIF によって生成された画像は安全で無害です。

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来上記の実験結果に基づいて、人間の類推と想像力の学習をシミュレートすることにより、この論文で設計された方法が効果的に実行できると信じる理由があります。小規模データ セットを増幅することで、小規模データ タスク シナリオにおけるディープ ニューラル ネットワークの実装とアプリケーションが向上します。

以上が新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。
CrewaiとOllamaでマルチエージェントシステムを構築する方法は?CrewaiとOllamaでマルチエージェントシステムを構築する方法は?Apr 12, 2025 am 09:44 AM

導入 APIにお金を費やしたくないのですか、それともプライバシーを心配していますか?それとも、LLMSをローカルに実行したいだけですか?心配しないで;このガイドは、ローカルLLMSを使用してエージェントとマルチエージェントフレームワークを構築するのに役立ちます

AVバイト:Openai' S O1モデル、Apple'の視覚的なAIなど - 分析VidhyaAVバイト:Openai' S O1モデル、Apple'の視覚的なAIなど - 分析VidhyaApr 12, 2025 am 09:38 AM

導入 今週は、人工知能の世界(AI)の主要な更新が詰め込まれています。 OpenaiのO1モデルから、高度な推論の紹介からAppleの画期的な視覚知能技術、Techまで

生産グレードのエージェントRAGパイプラインを監視する方法は?生産グレードのエージェントRAGパイプラインを監視する方法は?Apr 12, 2025 am 09:34 AM

導入 2022年、CHATGPTの立ち上げにより、ハイテク産業と非テクノロジーの両方の業界の両方に革命をもたらし、個人や組織にAIを生成しました。 2023年を通じて、大規模な言語モードの活用に集中しました

Star Schemaを使用してデータウェアハウスを最適化する方法は?Star Schemaを使用してデータウェアハウスを最適化する方法は?Apr 12, 2025 am 09:33 AM

Star Schemaは、データウェアハウジングとビジネスインテリジェンスで使用される効率的なデータベース設計です。データを整理し、周囲の寸法テーブルにリンクされた中央のファクトテーブルになります。この星のような構造は、複雑なqを簡素化します

マルチモーダルRAGシステムの構築に関する包括的なガイドマルチモーダルRAGシステムの構築に関する包括的なガイドApr 12, 2025 am 09:29 AM

RAGシステムとしてよく知られている検索拡張生成システムは、高価な微調整の手間なしでカスタムエンタープライズデータに関する質問に答えるインテリジェントAIアシスタントを構築するための事実上の標準となっています

エージェントラグシステムはどのようにテクノロジーを変換しますか?エージェントラグシステムはどのようにテクノロジーを変換しますか?Apr 12, 2025 am 09:21 AM

導入 人工知能は新しい時代に入りました。モデルが事前定義されたルールに基づいて単に情報を出力する時代は終わりました。今日のAIの最先端のアプローチは、Ragを中心に展開しています(検索装備

自動生成クエリのSQLアシスタント自動生成クエリのSQLアシスタントApr 12, 2025 am 09:13 AM

複雑なSQLクエリを書いたり、スプレッドシートを並べ替えたりせずに、データベースと話をしたり、単純な言語で質問したり、即座に答えを得たりすることを望んだことがありますか? LangchainのSQL Toolkit、Groq a

AIインデックス2025を読む:AIはあなたの友人、敵、または副操縦士ですか?AIインデックス2025を読む:AIはあなたの友人、敵、または副操縦士ですか?Apr 11, 2025 pm 12:13 PM

スタンフォード大学ヒト指向の人工知能研究所によってリリースされた2025年の人工知能インデックスレポートは、進行中の人工知能革命の良い概要を提供します。 4つの単純な概念で解釈しましょう:認知(何が起こっているのかを理解する)、感謝(利益を見る)、受け入れ(顔の課題)、責任(責任を見つける)。 認知:人工知能はどこにでもあり、急速に発展しています 私たちは、人工知能がどれほど速く発展し、広がっているかを強く認識する必要があります。人工知能システムは絶えず改善されており、数学と複雑な思考テストで優れた結果を達成しており、わずか1年前にこれらのテストで惨めに失敗しました。 2023年以来、複雑なコーディングの問題や大学院レベルの科学的問題を解決することを想像してみてください

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

AtomエディタMac版ダウンロード

AtomエディタMac版ダウンロード

最も人気のあるオープンソースエディター

MantisBT

MantisBT

Mantis は、製品の欠陥追跡を支援するために設計された、導入が簡単な Web ベースの欠陥追跡ツールです。 PHP、MySQL、Web サーバーが必要です。デモおよびホスティング サービスをチェックしてください。

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

強力な PHP 統合開発環境

EditPlus 中国語クラック版

EditPlus 中国語クラック版

サイズが小さく、構文の強調表示、コード プロンプト機能はサポートされていません

SecLists

SecLists

SecLists は、セキュリティ テスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティ テスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティ テストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジング ペイロード、機密データ パターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテスト マシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。