検索
ホームページテクノロジー周辺機器AIバリアフリーで旅行も安心! ByteDanceの研究成果がCVPR2022 AVAコンペティションチャンピオンシップで優勝

最近、CVPR2022の各種コンペティションの結果が続々と発表されており、ByteDanceの知的創造AIプラットフォーム「Byte-IC-AutoML」チームが合成データに基づくインスタンスセグメンテーションチャレンジ(Accessibility Vision and Autonomy Challenge)で優勝しました。 、以下 AVA と呼びます。 )、自社開発した Parallel Pre-trained Transformers (PPT) フレームワークを使用して頭角を現し、コンテストの唯一のトラックで優勝者になりました。

バリアフリーで旅行も安心! ByteDanceの研究成果がCVPR2022 AVAコンペティションチャンピオンシップで優勝

紙のアドレス https:/ /www.php.cn/link/ede529dfcbb2907e9760eea0875cdd12

この AVA コンテストは、ボストン大学とカーネギーメロン大学が共同で主催しています。

コンテストでは、障害のある歩行者と対話する自律システムのデータ サンプルを含むレンダリング エンジンを介して、合成インスタンス セグメンテーション データセットを導き出します。 コンテストの目標は、アクセシビリティに関連する人や物のターゲット検出とインスタンスのセグメンテーションのためのベンチマークと方法を提供することです。

バリアフリーで旅行も安心! ByteDanceの研究成果がCVPR2022 AVAコンペティションチャンピオンシップで優勝

#データセットの視覚化

##コンテストの難しさの分析

ドメイン汎化問題: このコンテストのデータセットはすべてレンダリング エンジンによって合成された画像であり、データ ドメインと自然画像の間には大きな違いがあります。 ;
  1. ロングテール/少数サンプル問題: データにはロングテール分布があり、「松葉杖」や「車椅子」のカテゴリがデータ セット内で少なく、セグメンテーション効果も悪くなります;
  2. セグメンテーションの堅牢性の問題: 一部のカテゴリのセグメンテーション効果は非常に低く、インスタンス セグメンテーション mAP はターゲット検出セグメンテーション mAP
  3. ## より 30 低いです。
  4. #技術ソリューションの詳細な説明

Byte-IC-AutoML チームは、Parallel Pre-trained Transformers (PPT) フレームワークを提案しました。これを達成します。このフレームワークは主に 3 つのモジュールで構成されています: 1) 並列大規模事前トレーニング済みトランスフォーマー、2) バランス コピー&ペースト データ強化、3) ピクセル レベルの非最大抑制とモデル融合、バリアフリーで旅行も安心! ByteDanceの研究成果がCVPR2022 AVAコンペティションチャンピオンシップで優勝

#並列大規模事前トレーニング Transformers

最近の事前トレーニングに関する記事の多くは、大規模なデータ セットで事前トレーニングされたモデルがさまざまな下流シナリオにうまく一般化できることを示しています。したがって、チームは

COCO

および

BigDetection

データ セットを使用して最初にモデルを事前トレーニングします。これにより、自然データと合成データの間のフィールドの偏差を大幅に軽減できます。合成データ シナリオで、ダウンストリームのサンプル数を減らした高速トレーニングに使用できます。モデル レベルでは、ビジョン トランスフォーマーには CNN の帰納的バイアスがなく、事前トレーニングの利点を享受できることを考慮して、チームは UniFormer CBNetV2 を使用します。 UniFormer は、畳み込みとセルフ アテンションを統合し、ローカル冗長性とグローバル依存性という 2 つの主要な問題を同時に解決し、効率的な特徴学習を実現します。 CBNetV2 アーキテクチャは、複合接続を通じて複数の同一のバックボーン パケットを連結し、高性能の検出器を構築します。モデルのバックボーン特徴抽出器はすべて Swin Transformer です。大規模な事前学習済みTransformerを複数並列配置し、出力結果を統合学習して最終結果を出力します。 #検証データ セットのさまざまなメソッドの mAP

バリアフリーで旅行も安心! ByteDanceの研究成果がCVPR2022 AVAコンペティションチャンピオンシップで優勝バランス コピー&ペースト データの強化

コピーアンドペースト手法は、オブジェクトをランダムに貼り付けることで、インスタンス セグメンテーション モデルに優れた結果をもたらします (特にロングテール分散下のデータセットの場合)。ただし、この方法ではすべてのカテゴリのサンプルが均等に増加し、カテゴリ分布のロングテール問題を根本的に軽減することはできません。そこでチームは、Balance Copy-Paste データ拡張手法を提案しました。コピー&ペーストのバランスをとれば、カテゴリの有効数に応じてカテゴリが適応的にサンプリングされ、全体的なサンプル品質が向上し、少数のサンプルとロングテール分布の問題が軽減され、最終的にインスタンス セグメンテーションにおけるモデルの mAP が大幅に向上します。

バリアフリーで旅行も安心! ByteDanceの研究成果がCVPR2022 AVAコンペティションチャンピオンシップで優勝

Balance Copy-Paste データ強化テクノロジーによる改善

ピクセルレベルの非最大値抑制とモデル融合

バリアフリーで旅行も安心! ByteDanceの研究成果がCVPR2022 AVAコンペティションチャンピオンシップで優勝

検証セットでのモデル融合アブレーション実験

バリアフリーで旅行も安心! ByteDanceの研究成果がCVPR2022 AVAコンペティションチャンピオンシップで優勝

モデル融合のテストセットでのアブレーション実験

現在、都市および交通データ セットは、通常の交通機関と歩行者のみを含む、より一般的なシーンです。このデータ セットには、障害者とその行動に関する情報が不足しています。そして、その補助器具の種類は、現在存在するデータセットを使用した検出モデルでは検出できません。

ByteDance Byte-IC-AutoML チームのこの技術ソリューションは、現在の自動運転と街路シーンの理解に広範囲に応用されています。これらの合成データを通じて取得されたモデルは、「 などのまれなカテゴリ」を識別できます。 「車椅子」「車椅子の人」「松葉杖の人」など、人や物をより正確に分類できるだけでなく、現場の誤解につながる判断ミスや判断ミスを防ぐことができます。さらに、このデータ合成方法を通じて、現実世界では比較的まれなカテゴリのデータを構築でき、それにより、より汎用性が高く完全なターゲット検出モデルをトレーニングできます。

Intelligent Creation は、ByteDance のマルチメディア イノベーション技術研究機関であり、総合的なサービス プロバイダーです。コンピュータビジョン、グラフィックス、音声、撮影・編集、特殊効果、クライアント、AIプラットフォーム、サーバーエンジニアリングなどの技術分野をカバーし、最先端のアルゴリズム-エンジニアリングシステム-製品のクローズドループを部門内に導入し、活用を目指しています。このようにして、当社は社内の事業部門と外部の協力顧客に、業界最先端のコンテンツ理解、コンテンツ作成、インタラクティブなエクスペリエンスと消費機能、および業界ソリューションを提供します。チームの技術力は、Volcano Engine を通じて外部の世界に公開されています。

Volcano Engine は ByteDance が所有するクラウド サービス プラットフォームで、ByteDance の急速な発展の中で蓄積された成長手法、技術力、ツールを外部企業に開放し、クラウド基盤、サービスなどを提供します。ビデオやコンテンツの配信、ビッグデータ、人工知能、開発、運用保守は、企業がデジタルアップグレード中に持続的な成長を達成するのに役立ちます。



#

以上がバリアフリーで旅行も安心! ByteDanceの研究成果がCVPR2022 AVAコンペティションチャンピオンシップで優勝の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。
Huggingface smollmであなたの個人的なAIアシスタントを構築する方法Huggingface smollmであなたの個人的なAIアシスタントを構築する方法Apr 18, 2025 am 11:52 AM

オンデバイスAIの力を活用:個人的なチャットボットCLIの構築 最近では、個人的なAIアシスタントの概念はサイエンスフィクションのように見えました。 ハイテク愛好家のアレックスを想像して、賢くて地元のAI仲間を夢見ています。

メンタルヘルスのためのAIは、スタンフォード大学でのエキサイティングな新しいイニシアチブによって注意深く分析されますメンタルヘルスのためのAIは、スタンフォード大学でのエキサイティングな新しいイニシアチブによって注意深く分析されますApr 18, 2025 am 11:49 AM

AI4MHの最初の発売は2025年4月15日に開催され、有名な精神科医および神経科学者であるLuminary Dr. Tom Insel博士がキックオフスピーカーを務めました。 Insel博士は、メンタルヘルス研究とテクノでの彼の傑出した仕事で有名です

2025年のWNBAドラフトクラスは、成長し、オンラインハラスメントの成長と戦いに参加します2025年のWNBAドラフトクラスは、成長し、オンラインハラスメントの成長と戦いに参加しますApr 18, 2025 am 11:44 AM

「私たちは、WNBAが、すべての人、プレイヤー、ファン、企業パートナーが安全であり、大切になり、力を与えられたスペースであることを保証したいと考えています」とエンゲルバートは述べ、女性のスポーツの最も有害な課題の1つになったものに取り組んでいます。 アノ

Pythonビルトインデータ構造の包括的なガイド-AnalyticsVidhyaPythonビルトインデータ構造の包括的なガイド-AnalyticsVidhyaApr 18, 2025 am 11:43 AM

導入 Pythonは、特にデータサイエンスと生成AIにおいて、プログラミング言語として優れています。 大規模なデータセットを処理する場合、効率的なデータ操作(ストレージ、管理、アクセス)が重要です。 以前に数字とstをカバーしてきました

Openaiの新しいモデルからの代替案からの第一印象Openaiの新しいモデルからの代替案からの第一印象Apr 18, 2025 am 11:41 AM

潜る前に、重要な注意事項:AIパフォーマンスは非決定論的であり、非常にユースケース固有です。簡単に言えば、走行距離は異なる場合があります。この(または他の)記事を最終的な単語として撮影しないでください。これらのモデルを独自のシナリオでテストしないでください

AIポートフォリオ| AIキャリアのためにポートフォリオを構築する方法は?AIポートフォリオ| AIキャリアのためにポートフォリオを構築する方法は?Apr 18, 2025 am 11:40 AM

傑出したAI/MLポートフォリオの構築:初心者と専門家向けガイド 説得力のあるポートフォリオを作成することは、人工知能(AI)と機械学習(ML)で役割を確保するために重要です。 このガイドは、ポートフォリオを構築するためのアドバイスを提供します

エージェントAIがセキュリティ運用にとって何を意味するのかエージェントAIがセキュリティ運用にとって何を意味するのかApr 18, 2025 am 11:36 AM

結果?燃え尽き症候群、非効率性、および検出とアクションの間の隙間が拡大します。これは、サイバーセキュリティで働く人にとってはショックとしてはありません。 しかし、エージェントAIの約束は潜在的なターニングポイントとして浮上しています。この新しいクラス

Google対Openai:学生のためのAIの戦いGoogle対Openai:学生のためのAIの戦いApr 18, 2025 am 11:31 AM

即時の影響と長期パートナーシップ? 2週間前、Openaiは強力な短期オファーで前進し、2025年5月末までに米国およびカナダの大学生にChatGpt Plusに無料でアクセスできます。このツールにはGPT ‑ 4o、Aが含まれます。

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SecLists

SecLists

SecLists は、セキュリティ テスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティ テスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティ テストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジング ペイロード、機密データ パターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテスト マシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。

PhpStorm Mac バージョン

PhpStorm Mac バージョン

最新(2018.2.1)のプロフェッショナル向けPHP統合開発ツール

AtomエディタMac版ダウンロード

AtomエディタMac版ダウンロード

最も人気のあるオープンソースエディター

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

強力な PHP 統合開発環境