ホームページ >テクノロジー周辺機器 >AI >NetEase Fuxi が CVPR 2023 UG2+ および VizWiz コンペティションで優勝し、彼の論文が TIP に選ばれました
最近、CVPR 2023 コンテストの結果が発表されました。 NetEase Fuxi Lab は、CVPR 2023 UG2 Haze ターゲット認識チャレンジと VizWiz 少数サンプル ターゲット認識チャレンジで 1 位を獲得しました。彼らの関連論文は、トップ国際ジャーナルである TIP にも受理されました。これは、NetEase Fuxi のコンピュータ ビジョン分野におけるトップの技術革新能力が国際的に高く評価されていることを示しています。
2023 年 2 月から 6 月にかけて、IEEE/CVF Computer Vision and Pattern Recognition Conference (CVPR) は、国際的なコンピュータ ビジョンとパターン認識の分野におけるトップ会議として、権威ある学術機関や著名な学術機関と協力して開催されます。 -世界中の有名な企業は、多くの課題を抱えていました。これらの課題は、多くの AI 研究チームからの広範な参加を集めています。 CVPRはこのほど、受賞結果の発表と賞状の発行を相次いで行った。 CVPRはIEEEが主催するAIのトップ学会として学術的な影響力と社会的認知度が極めて高い。
CVPR 2023 UG2 Object Detection in Haze Challenge と CVPR 2023 VizWiz Few-Shot Object Recognition Challenge で、NetEase Fuxi は中国科学技術大学の教師 Yu Jun とチームを組み、次の成果を達成しました。最初の場所。この協力は主に、コンピュータ ビジョンの分野におけるターゲット検出と少数サンプルのターゲット認識の 2 つの側面に焦点を当てています。これらの技術は、さまざまな分野の視覚タスクに幅広く使用できます。特に産業用アプリケーションでは、データの取得や注釈付けが難しいシナリオにおいて、少数サンプルのターゲット検出は非常に価値があり、重要です。このコンペティションの成功により、当社はコンピュータ ビジョン分野における NetEase Fuxi の研究力と革新能力を証明しました。当社は今後もコンピュータビジョン技術の開発を推進し、実用化に向けてより正確かつ効率的なソリューションを提供することに尽力してまいります。
UG2 の目標は、画像の復元および強調アルゴリズムを適用して分析パフォーマンスを向上させることで、「難しい」画像の分析を前進させることです。出場者は、問題のある条件下で撮影された画像の分析を改善するための新しいアルゴリズムを開発する任務を負っています。 VizWiz の目標は、視覚障害を持つ人々のテクノロジーのニーズと関心をより多くの人に認識させ、人工知能の研究者がアクセシビリティの障壁を取り除く新しいアルゴリズムの開発を奨励することです。通常、コンテストには、画像内のオブジェクトの識別、画像内のテキストの識別、画像に関する質問に答えるなどのタスクが含まれます。以下は、NetEase Fuxi の受賞論文の概要です。
教師なし異常検出のための全周波数チャネル選択表現
教師なし異常検出のための全周波数チャネル選択表現
キーワード: 教師なし画像異常検出
異常検出は視覚的な画像の理解において重要な役割を果たし、特定の画像が事前に設定された正常な状態から逸脱しているかどうかを判断するために使用されます。これは、新規性の検出、工業用画像ベースの製品品質監視、自動欠陥修復、人間の健康状態の監視、およびビデオ監視で広く使用されています。現在、主流の教師なし異常検出方法には、密度ベースの方法、分類ベースの方法、再構成ベースの方法という 3 つの主なタイプがあります。これらの方法は、画像の統計的特徴を分析し、正常なサンプルを学習し、画像を再構成することによって異常検出を実現し、さまざまなアプリケーションに信頼できるツールと技術サポートを提供します。
このうち、再構成ベースの手法は、再構成能力が低くパフォーマンスが低いため、ほとんど言及されていませんが、教師なしトレーニングに大量の追加のトレーニング サンプルを必要としません。産業用途で。この目的を達成するために、この研究は再構成ベースの方法の改善に焦点を当て、周波数の観点から感覚異常検出タスクを処理する初めての新しい全周波数チャネル選択的再構成ネットワーク (OCR-GAN) を提案します。多くの実験により、他の方法と比較してこの方法の有効性と優位性が証明されています。たとえば、追加のトレーニング データなしで、MVTec AD データセット上で新しい SOTA パフォーマンスが達成され、AUC は 98.3 で、再構成ベースの手法ベースラインの 38.1 および現在の SOTA 手法を 0.3 大幅に上回っています。
この論文では、スマート ゲームの互換性テストにおける UI の異常問題を解決する革新的なソリューションを提案しています。このソリューションは、人工知能技術を活用してゲーム実行時に発生するUIの異常を自動検出し、ゲームの互換性テストの自動化を実現します。画像異常検出テクノロジーを使用することで、生成された多数のゲーム インターフェイスのスクリーンショットをコンピューター ビジョンの観点から自動的に検出し、そこから UI の異常な画像を取得し、ゲーム開発者が問題の原因を迅速かつ正確に特定できるように支援し、効果的に節約します。ゲームのテスト 専門家の人件費。
この論文は、浙江大学の Liu Yong 教授のチームと共同で、IEEE Transactions on Image Processing (TIP) ジャーナルへの掲載に選ばれました。 TIP は、IEEE に基づく画像処理研究分野のトップジャーナルであり、中国科学院の SCI 分野のジャーナルであり、コンピューターグラフィックスおよびマルチメディア分野のカテゴリー A ジャーナル (CCF A) に推奨されています。中国コンピュータ協会による。 2022年から2023年のジャーナルのインパクトファクターは11.041に達します。
以上がNetEase Fuxi が CVPR 2023 UG2+ および VizWiz コンペティションで優勝し、彼の論文が TIP に選ばれましたの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。