機械学習モデルがオープンワールドのシナリオで使用されることが増えているため、配布外 (OOD) データを効果的に特定して処理する方法が重要な研究領域になっています。分布外のデータが存在すると、モデルの過信や不正確な予測につながる可能性があり、これは自動運転や医療診断などの安全性が重要なアプリケーションでは特に危険です。したがって、効果的な OOD 検出メカニズムを開発することは、実際のアプリケーションにおけるモデルの安全性と信頼性を向上させるために重要です。
従来の OOD 検出方法は、主に単一のパターン、特に画像データに焦点を当てており、テキスト データなど、他の潜在的に有用な情報ソースは無視しています。視覚言語モデル (VLM) の台頭により、マルチモーダル学習シナリオ、特に画像と関連するテキストの説明を同時に理解する必要があるタスクで優れたパフォーマンスを発揮することが実証されました。 VLM に基づく既存の OOD 検出方法 [3、4、5] は ID タグの意味情報のみを使用し、VLM モデルの強力なゼロサンプル機能と VLM が解釈できる非常に広い意味空間を無視しています。これに基づいて、VLM には OOD 検出において未開発の大きな可能性があり、特に画像とテキスト情報を包括的に利用して検出結果を向上させることができると考えています。
この記事は 3 つの質問を中心に展開します:
1. 非 ID タグの情報はゼロサンプル OOD 検出に役立ちますか?
2. ゼロサンプル OOD 検出に有益な情報をマイニングするにはどうすればよいですか?
3. マイニングされた情報をゼロサンプル OOD 検出に使用するにはどうすればよいですか?
このプロジェクトでは、OOD 検出に VLM を利用する NegLabel と呼ばれる革新的なアプローチを提案します。 NegLabel メソッドでは、特に「ネガティブ ラベル」メカニズムを導入しています。これらのネガティブ ラベルは、既知の ID カテゴリ ラベルと意味的に大きく異なります。画像と ID ラベルおよびネガティブ ラベルの親和性と性質を分析および比較することで、NegLabel は、以下に属する分布を効果的に区別できます。これにより、モデルの外部のサンプルを識別できるようになり、OOD サンプルを識別するモデルの能力が大幅に向上します。
NegLabel は、複数のゼロショット OOD 検出ベンチマーク テストで優れたパフォーマンスを達成しました。 ImageNet-1k などの大規模なデータセットでは、94.21% の AUROC と 25.40% の FPR95 を達成できます。 VLM に基づく OOD 検出方法と比較して、NegLabel は追加のトレーニング プロセスを必要としないだけでなく、優れたパフォーマンスを示します。さらに、NegLabel は、さまざまな VLM アーキテクチャ上で優れた多用途性と堅牢性を示します。
Øペーパーリンク: https://arxiv.org/pdf/2403.20078.pdf
Øコードリンク: https://github.com/tmlr- group/NegLabel
次に、ICLR 2024 で最近発表された、分布外検出の方向性に関する研究結果を簡単に共有します。
予備知識
手法の紹介
NegLabelの核心は「ネガティブラベル」機構の導入です。既知の ID に関連するカテゴリ ラベルには意味上の大きな違いがあります。NegLabel は、画像と ID ラベルおよびネガティブ ラベルの親和性を分析および比較することにより、分布外に属するサンプルを効果的に識別できるため、OOD サンプルを識別するモデルの能力が大幅に向上します。 。
図 1. NegLabel の概要
1. ネガティブ ラベルを選択するにはどうすればよいですか?
2. OOD 検出にネガティブラベルを使用する方法は?
3. ネガティブサンプルがゼロサンプル OOD 検出を促進する可能性があることをどのように理解すればよいでしょうか?
実験結果
私たちの研究活動は、私たちが提案する方法の性能と根底にあるメカニズムを理解するために、多次元の実験結果を提供します。
以下の表に示すように、多くのベンチマーク手法や優れたパフォーマンスを備えた高度な手法と比較して、この記事で提案する手法は、大規模なデータセット (たとえば、イメージネット)。
さらに、以下の表に示すように、この記事の方法は、ID データがドメイン移行される場合の堅牢性が優れています。
次の 2 つの表では、NegLabel の各モジュールと VLM の構造についてアブレーション実験を実施しました。左側の表からわかるように、NegMining アルゴリズムとグループ化戦略の両方により、OOD 検出のパフォーマンスを効果的に向上させることができます。右側の表は、私たちが提案した NegLabel アルゴリズムがさまざまな構造の VLM に良好に適応できることを示しています。
また、ID タグとネガティブ タグに対するさまざまな入力画像の親和性の視覚的分析も実行しました。詳細な実験と結果については、元の記事を参照してください。
参考文献
[1] Hendrycks, D. および Gimpel, K. 誤分類およびアウトを検出するためのベースラインICLR における -of-distribution の例、2017。
[2] Alec Radford、Jong Wook Kim、Chris Hallacy、Aditya Ramesh、Gabriel Goh、Sandhini Agarwal、Girish Sastry、Amanda Askell、Pamela Mishkin 、ジャック クラーク、他、ICML での学習転送可能なビジュアル モデル、2021.
[3] Sepideh Esmaeilpour、Bing Liu、Eric Robertson、および Lei Shu のゼロショット。 AAAI、2022 での分布検出。
[4] Yifei Ming、Ziyang Cai、Jixiang Gu、Yiyou Sun、Wei Li、Yixuan Li による分布外検出の詳細。 NeurIPS、2022a.
[5] Hualiang Wang、Yi Li、Huifeng Yao、Xiaomeng Li、ゼロショット OOD 検出に関する指導クリップ、2023 年。 .
[6] Christiane Fellbaum、WordNet: 電子語彙データベース、1998 年。
以上がICLR 2024 スポットライト | ネガティブ ラベル マイニングにより、CLIP ベースの配布外検出タスクが容易になりますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

データの課題:正確な洞察のためのSQLのケースステートメントのマスター あなたがデータ愛好家を持っているとき、誰が弁護士を必要としますか? データアナリスト、科学者、および膨大なデータの世界の全員が独自の複雑な課題に直面し、システム機能FLAを確保する

AIの知識チェーンの力を活用:迅速なエンジニアリングに深く潜る 人工知能(AI)はあなたの質問を理解するだけでなく、洞察に満ちた答えを提供するために膨大な量の知識を織り込むことができることを知っていますか?

導入 Joanna Maciejewskaは最近、Xに関する洞察に満ちた観察を共有しました。 AIプッシュの最大の課題は? それは誤った方向です。 AIに洗濯と料理を扱ってもらいたいので、アートとライティングに集中できるようにしてください。 - ジョアンナ・マ

Meta'sLlama3.1:オープンソースLLM機能に深く飛び込む メタは、オープンソースの大手言語モデル(LLMS)で引き続き充電をリードしています。 LlamaからLlama 2、Llama 3、および現在のLlama 3.1に進化するLlamaファミリーは、へのコミットメントを示しています

導入 統計プロセス制御(SPC)チャートは、品質管理に不可欠なツールであり、組織がプロセスを監視、制御、改善できるようにします。 統計的方法を適用することにより、SPCチャートはデータのバリエーションを視覚的に表します

このガイドは、初心者、中級、高度なレベルにまたがる30の質問をカバーすることにより、MySQLインタビューに備えています。 データ管理と分析の重要なツールであるMySQLは、理論的概念と実用的なクエリの例を通じて検討されています

適切なデータベースの選択:リレーショナルと非関係 賑やかなカフェを管理することを想像してください:無数の注文、在庫レベルの変動、および要求の厳しい顧客を想像してください。 効率的なツールは成功に不可欠です。 同様に、大規模なデータセットを処理するにはcが必要です

ヒューマノイドロボット:未来を垣間見る 何世紀にもわたって、複雑な時計仕掛けのメカニズムから洗練されたAI駆動の作品まで、ヒューマノイドロボットの概念が私たちの想像力を捉えました。 ジャック・デ・ヴォーカンソンのメカニックなどの初期の例


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

SecLists
SecLists は、セキュリティ テスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティ テスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティ テストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジング ペイロード、機密データ パターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテスト マシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。

ドリームウィーバー CS6
ビジュアル Web 開発ツール

ZendStudio 13.5.1 Mac
強力な PHP 統合開発環境
