6月7日、人工知能のトップ国際会議CVPR 2023が開催した、世界の有名大学や研究者が参加した最初の大規模モデルチャレンジ(CVPR 2023 Workshop on Foundation Model:第1回基礎モデルチャレンジ)が閉幕した。世界中の有名企業から 1,024 名の参加者が参加。 2か月にわたる熾烈な競争を経て、Tianyi Cloud AIチーム(チーム名CTRL)がマルチタスクの大型模型トラックで好成績を収め、この大会の優勝を獲得した。
(画像出典: Photo Network)
CVPRカンファレンスは、IEEEが主催するコンピュータビジョンとパターン認識に関する国際学術会議で、この分野の最新の研究成果や技術開発が報告されており、コンピュータビジョンに関する世界三大カンファレンスの一つです。
従来のビジュアル モデルの作成プロセスは通常、単一のタスクを使用してトレーニングを最初から開始し、各タスクが相互に学習することができません。単一タスクのデータが限られているため、モデルの実際の効果はタスク データの分布に大きく依存し、さまざまなシナリオに対する汎化効果は通常不十分です。
近年、ビッグデータ事前学習技術が急速に発展しており、大量のデータを使って一般知識を学習し、それを下流のタスクに転送することで、本質的に異なるタスク間の相互学習を実現します。大量のデータに基づいて事前トレーニングされたモデルは知識の完全性が高く、下流タスクの微調整に少量のデータが使用された場合でも良好な結果を達成できます。しかし、事前トレーニングと下流タスクの微調整に基づくモデル作成プロセスでは、タスクごとにモデルを個別にトレーニングする必要があり、研究開発に多くのリソースを消費します。対照的に、マルチタスク トレーニング スキームは、複数のタスクからのデータを使用して強力な一般モデルをトレーニングします。これは、複数のタスクを処理するために直接適用できるため、モデルの生産性と汎化機能が効果的に向上します。
このコンテストでは、出場者は単一のモデルを使用して、交通シーンにおける分類、検出、セグメンテーションという 3 つの代表的なタスクの共同トレーニングを同時に完了する必要があります。 Tianyi Cloud AI チームは、モデル設計におけるアルゴリズム開発の豊富な経験を活用し、2 位のパラメーターの 60% のみを含む事前トレーニング済みモデルを選択し、少ないパラメーターで高い精度を実現しました。
マルチタスクトレーニングにおける各ブランチの一貫性のない損失関数と勾配によって引き起こされる収束の遅さの問題を解決するために、Tianyi Cloud AI チームは損失均等化と勾配スケールの統合の方法を採用し、各ブランチの損失関数のバランスをとりました。タスクのブランチとメイクの勾配は一貫したスケールを持つため、トレーニング効率とモデルの収束速度が向上します。さらに、Tianyi Cloud AI チームは、慎重に設計されたタスク固有の機能ピラミッドとアテンション メカニズムを使用して、各ブランチ タスクが自身のタスクにより効果的なバックボーン ネットワーク内の機能を利用できるようにし、全体の精度とパフォーマンスをさらに向上させます。モデル。
上記のモデル設計とトレーニング戦略を通じて、Tianyi Cloud AI チームは競争で優れた成績を収め、画像、音声、マルチモダリティの分野での深い蓄積と継続的な革新能力を十分に実証しました。今後も、Tianyi Cloudは人工知能の広大な分野で革新と探求を続け、より高度な技術と優れた結果でより多くのユーザーに利益をもたらし、何千もの業界のデジタル開発のサポートを提供していきます。
以上がTianyi Cloud が International AI Summit Large Model Challenge で優勝の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

この記事では、テキストデータを分析するための自然言語処理(NLP)の重要なツールである周波数逆文書頻度(TF-IDF)手法について説明します。 TF-IDFは、TEを重み付けすることにより、基本的なワードバッグアプローチの限界を上回ります

LangchainでAIエージェントの力を解き放つ:初心者向けガイド 祖母にchatgptとチャットすることで人工知能の不思議を示すことを想像してみてください。 th

ミストラル大規模2:ミストラルAIの強力なオープンソースLLMに深く飛び込む メタAIの最近のラマ3.1ファミリーのモデルのリリースに続いて、これまでの最大のモデルのミストラルAIの発表がすぐに続きました。

拡散モデルのノイズスケジュールの理解:包括的なガイド AIによって生み出されたデジタルアートの見事なビジュアルに魅了されたことがあり、基礎となるメカニズムについて疑問に思ったことはありますか? 重要な要素は、「ノイズスケジュール、&Quo

GPT-4Oでコンテキストチャットボットを構築する:包括的なガイド AIとNLPの急速に進化する風景では、チャットボットは開発者と組織にとって不可欠なツールになりました。 本当に魅力的でインテリジェントなチャットを作成する重要な側面

この記事では、AIエージェントを構築するための7つの主要なフレームワーク、つまり目標を達成するために知覚、決定、行動する自律的なソフトウェアエンティティについて説明します。 これらのエージェントは、従来の補強学習を上回り、高度な計画と理想を活用します

統計的仮説検定におけるタイプIおよびタイプIIエラーの理解 新しい血圧薬をテストする臨床試験を想像してください。 この試験では、この薬は血圧を大幅に低下させると結論付けていますが、実際にはそうではありません。これはタイプです

Sumy:AIを搭載した要約アシスタント 無限の文書をふるいにかけるのにうんざりしていませんか? 強力なPythonライブラリであるSumyは、自動テキストの要約のための合理化されたソリューションを提供します。 この記事では、Sumyの能力を調べて、あなたを導きます


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

MinGW - Minimalist GNU for Windows
このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポート ライブラリとヘッダー ファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。

SublimeText3 英語版
推奨: Win バージョン、コードプロンプトをサポート!

SublimeText3 中国語版
中国語版、とても使いやすい

SAP NetWeaver Server Adapter for Eclipse
Eclipse を SAP NetWeaver アプリケーション サーバーと統合します。

PhpStorm Mac バージョン
最新(2018.2.1)のプロフェッショナル向けPHP統合開発ツール
