Tianyi Cloud が International AI Summit Large Model Challenge で優勝-AI-php.cn

ホームページ

テクノロジー周辺機器

Tianyi Cloud が International AI Summit Large Model Challenge で優勝

王林

Jun 13, 2023 pm 04:44 PM

天一の雲アイトップ会議

6月7日、人工知能のトップ国際会議CVPR 2023が開催した、世界の有名大学や研究者が参加した最初の大規模モデルチャレンジ（CVPR 2023 Workshop on Foundation Model：第1回基礎モデルチャレンジ）が閉幕した。世界中の有名企業から 1,024 名の参加者が参加。 2か月にわたる熾烈な競争を経て、Tianyi Cloud AIチーム（チーム名CTRL）がマルチタスクの大型模型トラックで好成績を収め、この大会の優勝を獲得した。

Tianyi Cloud が International AI Summit Large Model Challenge で優勝

(画像出典: Photo Network)

CVPRカンファレンスは、IEEEが主催するコンピュータビジョンとパターン認識に関する国際学術会議で、この分野の最新の研究成果や技術開発が報告されており、コンピュータビジョンに関する世界三大カンファレンスの一つです。

従来のビジュアルモデルの作成プロセスは通常、単一のタスクを使用してトレーニングを最初から開始し、各タスクが相互に学習することができません。単一タスクのデータが限られているため、モデルの実際の効果はタスクデータの分布に大きく依存し、さまざまなシナリオに対する汎化効果は通常不十分です。

近年、ビッグデータ事前学習技術が急速に発展しており、大量のデータを使って一般知識を学習し、それを下流のタスクに転送することで、本質的に異なるタスク間の相互学習を実現します。大量のデータに基づいて事前トレーニングされたモデルは知識の完全性が高く、下流タスクの微調整に少量のデータが使用された場合でも良好な結果を達成できます。しかし、事前トレーニングと下流タスクの微調整に基づくモデル作成プロセスでは、タスクごとにモデルを個別にトレーニングする必要があり、研究開発に多くのリソースを消費します。対照的に、マルチタスクトレーニングスキームは、複数のタスクからのデータを使用して強力な一般モデルをトレーニングします。これは、複数のタスクを処理するために直接適用できるため、モデルの生産性と汎化機能が効果的に向上します。

このコンテストでは、出場者は単一のモデルを使用して、交通シーンにおける分類、検出、セグメンテーションという 3 つの代表的なタスクの共同トレーニングを同時に完了する必要があります。 Tianyi Cloud AI チームは、モデル設計におけるアルゴリズム開発の豊富な経験を活用し、2 位のパラメーターの 60% のみを含む事前トレーニング済みモデルを選択し、少ないパラメーターで高い精度を実現しました。

マルチタスクトレーニングにおける各ブランチの一貫性のない損失関数と勾配によって引き起こされる収束の遅さの問題を解決するために、Tianyi Cloud AI チームは損失均等化と勾配スケールの統合の方法を採用し、各ブランチの損失関数のバランスをとりました。タスクのブランチとメイクの勾配は一貫したスケールを持つため、トレーニング効率とモデルの収束速度が向上します。さらに、Tianyi Cloud AI チームは、慎重に設計されたタスク固有の機能ピラミッドとアテンションメカニズムを使用して、各ブランチタスクが自身のタスクにより効果的なバックボーンネットワーク内の機能を利用できるようにし、全体の精度とパフォーマンスをさらに向上させます。モデル。

上記のモデル設計とトレーニング戦略を通じて、Tianyi Cloud AI チームは競争で優れた成績を収め、画像、音声、マルチモダリティの分野での深い蓄積と継続的な革新能力を十分に実証しました。今後も、Tianyi Cloudは人工知能の広大な分野で革新と探求を続け、より高度な技術と優れた結果でより多くのユーザーに利益をもたらし、何千もの業界のデジタル開発のサポートを提供していきます。

以上がTianyi Cloud が International AI Summit Large Model Challenge で優勝の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は搜狐で複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

TFIDFVectorizerを使用して、テキストドキュメントをTF-IDFマトリックスに変換しますApr 18, 2025 am 10:26 AM

この記事では、テキストデータを分析するための自然言語処理（NLP）の重要なツールである周波数逆文書頻度（TF-IDF）手法について説明します。 TF-IDFは、TEを重み付けすることにより、基本的なワードバッグアプローチの限界を上回ります

Langchainを使用したスマートAIエージェントの構築：実用的なガイドApr 18, 2025 am 10:18 AM

LangchainでAIエージェントの力を解き放つ：初心者向けガイド祖母にchatgptとチャットすることで人工知能の不思議を示すことを想像してみてください。 th

Mistral Large 2：Llama 3.1 405bに挑戦するのに十分強力ですか？Apr 18, 2025 am 10:16 AM

ミストラル大規模2：ミストラルAIの強力なオープンソースLLMに深く飛び込むメタAIの最近のラマ3.1ファミリーのモデルのリリースに続いて、これまでの最大のモデルのミストラルAIの発表がすぐに続きました。

安定した拡散のノイズスケジュールとは何ですか？ - 分析VidhyaApr 18, 2025 am 10:15 AM

拡散モデルのノイズスケジュールの理解：包括的なガイド AIによって生み出されたデジタルアートの見事なビジュアルに魅了されたことがあり、基礎となるメカニズムについて疑問に思ったことはありますか？重要な要素は、「ノイズスケジュール、＆Quo

GPT-4Oで会話のチャットボットを構築する方法は？ - 分析VidhyaApr 18, 2025 am 10:06 AM

GPT-4Oでコンテキストチャットボットを構築する：包括的なガイド AIとNLPの急速に進化する風景では、チャットボットは開発者と組織にとって不可欠なツールになりました。本当に魅力的でインテリジェントなチャットを作成する重要な側面

2025年にAIエージェントを構築するためのトップ7フレームワークApr 18, 2025 am 10:00 AM

この記事では、AIエージェントを構築するための7つの主要なフレームワーク、つまり目標を達成するために知覚、決定、行動する自律的なソフトウェアエンティティについて説明します。これらのエージェントは、従来の補強学習を上回り、高度な計画と理想を活用します

タイプIとタイプIIエラーの違いは何ですか？ - 分析VidhyaApr 18, 2025 am 09:48 AM

統計的仮説検定におけるタイプIおよびタイプIIエラーの理解新しい血圧薬をテストする臨床試験を想像してください。この試験では、この薬は血圧を大幅に低下させると結論付けていますが、実際にはそうではありません。これはタイプです

Sumy Libraryによる自動テキスト要約Apr 18, 2025 am 09:37 AM

Sumy：AIを搭載した要約アシスタント無限の文書をふるいにかけるのにうんざりしていませんか？強力なPythonライブラリであるSumyは、自動テキストの要約のための合理化されたソリューションを提供します。この記事では、Sumyの能力を調べて、あなたを導きます

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポートライブラリとヘッダーファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。