新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来-AI-php.cn

ホームページ

テクノロジー周辺機器

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来

PHPz

Dec 14, 2023 pm 09:49 PM

モデル電車

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来

論文リンク: https://browse.arxiv.org/pdf/2211.13976.pdf

ご存知のとおり、ディープニューラルネットワークのパフォーマンスはトレーニングデータに大きく依存します。量と質のせいで、ディープラーニングを小規模なデータタスクに広く適用することが困難になります。たとえば、医療やその他の分野での小規模データのアプリケーションシナリオでは、大規模なデータセットを手動で収集してラベル付けするのは、多くの場合、時間と労力がかかります。このデータ不足の問題に対処し、データ収集コストを最小限に抑えるために、この論文では、新しいデータを自動的に生成して、ターゲットタスクの小さなデータセットをより大きく、より情報量の多いデータセットに拡張することを目的とした、データセット拡張の新しいパラダイムを検討します。セット。これらの拡張データセットは、モデルのパフォーマンスと汎化機能の向上に特化しており、さまざまなネットワーク構造のトレーニングに使用できます

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来

この成果は、既存の方法を使用するだけではデータセットを十分に拡張できないということです。 (1) ランダムデータ強化は主に画像の表面の視覚特性を変更しますが、新しいオブジェクトの内容を含む画像を作成することはできません (下の画像の蓮は同じであり、新しい蓮は生成されません)。そのため、導入される情報量は限定。さらに深刻なのは、ランダムなデータ強調により、医用画像の病変（変化）位置が切り取られる可能性があり、その結果、サンプルの重要な情報が減少し、さらにはノイズの多いデータが生成される可能性があることです。 (2) データセットの増幅に事前トレーニング済みの生成 (拡散) モデルを直接使用しても、ターゲットタスクでのモデルのパフォーマンスを十分に向上させることはできません。これは、これらの生成モデルの事前トレーニングデータには、ターゲットデータとの大きな分布の差があることが多く、その結果、生成されるデータとターゲットタスクの間に一定の分布とカテゴリのギャップが生じ、生成されたデータがターゲットタスクと一致することを保証することが不可能であるためです。サンプルには正しいカテゴリとラベルがあり、モデルのトレーニングに役立ちます。

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来

#より効率的なデータセットの拡張を実現するために、研究者は人間の連合学習を研究してきました。人間は、ある物体についての事前知識があれば、下の写真のさまざまな種類、色、形、背景の犬のバリエーションなど、その物体のさまざまなバリエーションを容易に想像できます。この想像力豊かな学習プロセスは、画像内の動物の外観を単に混乱させるだけでなく、豊富な事前知識を適用して新しい情報を含むさまざまな画像を作成するため、データセットの増幅にとって非常に有益です。

しかし、データ想像力のためのアプリオリなモデルとして人間を直接モデル化することはできません。幸いなことに、最近の生成モデル (安定拡散、DALL-E2 など) は、大規模なデータセットの分布に適合する強力な機能を実証しており、リッチでリアルな画像を生成できます。このことから、この論文では、事前にトレーニングされた生成モデルを事前モデルとして使用し、その強力な事前知識を活用して、小規模なデータセットに対して効率的なデータの関連付けと増幅を実行するようになりました。

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来

上記のアイデアに基づいて、この研究は新しい Guided Imagination Framework (GIF) を提案します。この方法により、自然画像や医療画像のタスクに対するディープニューラルネットワークの分類パフォーマンスと汎化能力が効果的に向上し、手動によるデータ収集と注釈付けによって生じる膨大なコストが大幅に削減されます。同時に、拡張されたデータセットはモデルの転移学習を促進し、ロングテール問題を軽減するのにも役立ちます。

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来

次に、このデータセット増幅の新しいパラダイムがどのように設計されているかを見てみましょう。

方法

データセット増幅の課題と指針となる標準 データセット増幅を設計するには 2 つの方法があります。課題: (1) 生成されたサンプルに正しいカテゴリラベルを付けるにはどうすればよいでしょうか? (2) 生成されたサンプルにモデルのトレーニングを促進するための新しい情報が含まれていることを確認するにはどうすればよいですか?これら 2 つの課題に対処するために、この研究では広範な実験を通じて 2 つの増幅指針基準、(1) カテゴリ一貫した情報の強化、(2) サンプルの多様性の向上を発見しました。

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来

方法論的フレームワーク 発見された増幅指針基準に基づいて、この研究は、誘導された想像力の増幅フレームワークを提案します。 (GIF)。各入力シードサンプル x に対して、GIF は最初に前の生成モデルの特徴抽出器を使用してサンプル特徴 f を抽出し、特徴に対してノイズ摂動を実行します: 新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来。ノイズ (z、b) を設定する最も簡単な方法は、ガウスランダムノイズを使用することですが、生成されたサンプルに正しいクラスラベルが付けられ、より多くの情報がもたらされることを保証できません。したがって、効率的なデータセット増幅のために、GIF は発見された増幅ガイドライン、つまり新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来に基づいてノイズ摂動を最適化します。

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来

#使用される増幅ガイダンス標準は次のように実装されます。クラス一貫性のある情報量インデックス: 新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来 ; サンプル多様性インデックス: 。これら 2 つの指標を最大化することで、GIF はノイズ摂動を効果的に最適化し、それによってカテゴリの一貫性を維持し、より多くの情報コンテンツをもたらすサンプルを生成できます。

実験

増幅効果 GIF はより強い増幅効果を持っています: GIF-SD は、 6 つの自然データセットでは分類精度が平均 36.9% 向上し、3 つの医療データセットでは分類精度が平均 13.5% 向上しました。

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来

増幅効率 GIF はより強い増幅効率を持っています: 車と DTD データセットでは、 GIF-SD を使用した 5 倍増幅の効果は、ランダムデータ拡張を使用した 20 倍増幅の効果をも上回ります。

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来

#可視化結果 既存のデータ拡張手法では新しい画像コンテンツを生成できませんが、GIF の方がより適切に生成できます。新しいコンテンツを含むサンプル。

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来

既存の強調方法では、医療画像内の病変の位置がカットされる可能性があり、その結果、サンプル情報とノイズが減少しますが、GIF はより適切に保存されます。セマンティクス

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来

計算コストと時間コスト 手動によるデータ収集と注釈と比較して、GIF は大幅にコストを削減できます。データセットの増強にかかる時間とコスト。

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来

増幅されたデータの汎用性 これらのデータセットは、増幅されると、さまざまなニューラルネットワークモデルのトレーニングに直接使用できます。構造。

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来

#モデルの汎化能力の向上 GIF は、モデルの分布外汎化パフォーマンスの向上に役立ちます(OOD の一般化)。

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来

#ロングテール問題の軽減 GIF はロングテール問題の軽減に役立ちます。

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来

#安全性チェック

GIF によって生成された画像は安全で無害です。

新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来上記の実験結果に基づいて、人間の類推と想像力の学習をシミュレートすることにより、この論文で設計された方法が効果的に実行できると信じる理由があります。小規模データセットを増幅することで、小規模データタスクシナリオにおけるディープニューラルネットワークの実装とアプリケーションが向上します。

以上が新しい GIF フレームワークの紹介: 人間の例に倣い、データセット増幅の新しいパラダイムが到来の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

踊りましょう：私たちの人間のニューラルネットを微調整するための構造化された動きApr 27, 2025 am 11:09 AM

科学者は、彼らの機能を理解するために、人間とより単純なニューラルネットワーク（C. elegansのものと同様）を広く研究してきました。ただし、重要な疑問が生じます。新しいAIと一緒に効果的に作業するために独自のニューラルネットワークをどのように適応させるのか

新しいGoogleリークは、Gemini AIのサブスクリプションの変更を明らかにしますApr 27, 2025 am 11:08 AM

GoogleのGemini Advanced：Horizonの新しいサブスクリプションティア現在、Gemini Advancedにアクセスするには、1か月あたり19.99ドルのGoogle One AIプレミアムプランが必要です。ただし、Android Authorityのレポートは、今後の変更を示唆しています。最新のGoogle p

データ分析の加速がAIの隠されたボトルネックをどのように解決しているかApr 27, 2025 am 11:07 AM

高度なAI機能を取り巻く誇大宣伝にもかかわらず、エンタープライズAIの展開内に大きな課題が潜んでいます：データ処理ボトルネック。 CEOがAIの進歩を祝う間、エンジニアはクエリの遅い時間、過負荷のパイプライン、

MarkitDown MCPは、任意のドキュメントをマークダウンに変換できます！Apr 27, 2025 am 09:47 AM

ドキュメントの取り扱いは、AIプロジェクトでファイルを開くだけでなく、カオスを明確に変えることです。 PDF、PowerPoint、Wordなどのドキュメントは、あらゆる形状とサイズでワークフローをフラッシュします。構造化された取得

建物のエージェントにGoogle ADKを使用する方法は？ - 分析VidhyaApr 27, 2025 am 09:42 AM

Googleのエージェント開発キット（ADK）のパワーを活用して、実際の機能を備えたインテリジェントエージェントを作成します。このチュートリアルは、ADKを使用して会話エージェントを構築し、GeminiやGPTなどのさまざまな言語モデルをサポートすることをガイドします。 w

効果的な問題解決のためにLLMを介したSLMの使用 - 分析VidhyaApr 27, 2025 am 09:27 AM

まとめ： Small Language Model（SLM）は、効率のために設計されています。それらは、リソース不足、リアルタイム、プライバシーに敏感な環境の大手言語モデル（LLM）よりも優れています。特にドメインの特異性、制御可能性、解釈可能性が一般的な知識や創造性よりも重要である場合、フォーカスベースのタスクに最適です。 SLMはLLMSの代替品ではありませんが、精度、速度、費用対効果が重要な場合に理想的です。テクノロジーは、より少ないリソースでより多くを達成するのに役立ちます。それは常にドライバーではなく、プロモーターでした。蒸気エンジンの時代からインターネットバブル時代まで、テクノロジーの力は、問題の解決に役立つ範囲にあります。人工知能（AI）および最近では生成AIも例外ではありません

コンピュータービジョンタスクにGoogle Geminiモデルを使用する方法は？ - 分析VidhyaApr 27, 2025 am 09:26 AM

コンピュータービジョンのためのGoogleGeminiの力を活用：包括的なガイド大手AIチャットボットであるGoogle Geminiは、その機能を会話を超えて拡張して、強力なコンピュータービジョン機能を網羅しています。このガイドの利用方法については、

Gemini 2.0 Flash vs O4-Mini：GoogleはOpenaiよりもうまくやることができますか？Apr 27, 2025 am 09:20 AM

2025年のAIランドスケープは、GoogleのGemini 2.0 FlashとOpenaiのO4-Miniの到着とともに感動的です。数週間離れたこれらの最先端のモデルは、同等の高度な機能と印象的なベンチマークスコアを誇っています。この詳細な比較

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

AtomエディタMac版ダウンロード

最も人気のあるオープンソースエディター

ドリームウィーバー CS6

ビジュアル Web 開発ツール

WebStorm Mac版

便利なJavaScript開発ツール

DVWA

Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、