You Yang のチームは、単一の V100 を使用してモデルを 72 倍高速にトレーニングすることで、AAAI 2023 優秀論文賞で新たな結果を獲得しました。-AI-php.cn

ホームページ

テクノロジー周辺機器

You Yang のチームは、単一の V100 を使用してモデルを 72 倍高速にトレーニングすることで、AAAI 2023 優秀論文賞で新たな結果を獲得しました。

王林

May 10, 2023 am 09:04 AM

アルゴリズムモデル

この記事はAI New Media Qubit（公開アカウントID:QbitAI）の許可を得て転載していますので、転載については出典元にご連絡ください。

たった今、カリフォルニア大学バークレー校の博士でシンガポール国立大学の学長である若い教授You Yangが最新ニュースを発表しました——

AAAI 2023優秀論文賞（優秀論文）!

单块V100训练模型提速72倍！尤洋团队新成果获AAAI 2023杰出论文奖

研究結果により、モデルのトレーニング速度が一度に 72 倍 向上しました。

新聞を読んだ後、ネチズンでさえため息をつきました:

12時間から10分まで、柔らかい牛さん(牛さん)ああ!

单块V100训练模型提速72倍！尤洋团队新成果获AAAI 2023杰出论文奖

You Yang 博士は、在学中に ImageNet と BERT のトレーニング速度の世界記録を樹立したことがあります。

彼が設計したアルゴリズムは、Google、Microsoft、Intel、NVIDIA などの大手テクノロジー企業でも広く使用されています。

現在、彼は自分のビジネスを始めるために中国に戻りました Luchen Technology 1年半後、彼と彼のチームはどのようなアルゴリズムを考え出し、このような栄誉を獲得しましたかAIのトップカンファレンスで？

トレーニング時間は 12 時間から 10 分へ

この研究で、You Yang のチームは、CTR 予測モデルバッチの開発を加速できる最適化戦略 CowClip を提案しました。トレーニング。

CTR（クリックスルー率）予測モデルは、パーソナライズされた推奨シナリオで一般的に使用されるアルゴリズムです。

通常、ユーザーのフィードバック (クリック、コレクション、購入など) を学習する必要がありますが、オンラインで毎日生成されるデータの量は前例のないほど膨大です。

单块V100训练模型提速72倍！尤洋团队新成果获AAAI 2023杰出论文奖

したがって、CTR 予測モデルのトレーニングを高速化することが重要です。

一般的に、

バッチトレーニング はトレーニング速度を上げるために使用されますが、バッチサイズが大きすぎるとモデルの精度が低下します。

数学的分析を通じて、チームは、頻度の低い特徴の学習率

(頻度の低い特徴の学習率) は、バッチを拡張するときにスケーリングすべきではないことを証明しました。

单块V100训练模型提速72倍！尤洋团队新成果获AAAI 2023杰出论文奖

同社が提案する CowClip を使用すると、バッチサイズを簡単かつ効果的に拡張できます。

单块V100训练模型提速72倍！尤洋团队新成果获AAAI 2023杰出论文奖

チームは、4 つの CTR 予測モデルと 2 つのデータセットでテストを行うことで、元のバッチサイズを

128 回 拡張することに成功しました。精度が失われる原因となります。

特に DeepFM では、CowClip はバッチサイズを 1K から 128K に拡張することにより、AUC で 0.1% 以上の改善を達成しました。

また、単一の V100 GPU では、トレーニング時間は元の 12 時間からわずか 10 分に短縮され、トレーニング速度は

72 倍です。

单块V100训练模型提速72倍！尤洋团队新成果获AAAI 2023杰出论文奖

現在、プロジェクトコードはオープンソースです。研究チームによると、このアルゴリズムはNLPなどのタスクにも適しているという。

チーム紹介

この記事の最初の著者は、You Yang の博士課程の学生

Zheng Zangwei

で、南京大学のコンピュータエリートクラスを卒業し、学士号と学士号を取得しました。シンガポール国立大学で博士号を取得。彼の研究方向には、機械学習、コンピュータービジョン、ハイパフォーマンスコンピューティングが含まれます。

以上がYou Yang のチームは、単一の V100 を使用してモデルを 72 倍高速にトレーニングすることで、AAAI 2023 優秀論文賞で新たな結果を獲得しました。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

外挿の包括的なガイドApr 15, 2025 am 11:38 AM

導入数週間で作物の進行を毎日観察する農民がいるとします。彼は成長率を見て、さらに数週間で彼の植物がどれほど背が高くなるかについて熟考し始めます。 thから

ソフトAIの台頭とそれが今日のビジネスにとって何を意味するかApr 15, 2025 am 11:36 AM

ソフトAIは、おおよその推論、パターン認識、柔軟な意思決定を使用して特定の狭いタスクを実行するように設計されたAIシステムとして定義されていますが、曖昧さを受け入れることにより、人間のような思考を模倣しようとします。しかし、これはBusineにとって何を意味しますか

AIフロンティア向けの進化するセキュリティフレームワークApr 15, 2025 am 11:34 AM

答えは明確です。クラウドコンピューティングには、クラウドネイティブセキュリティツールへの移行が必要であるため、AIはAIの独自のニーズに特化した新しい種類のセキュリティソリューションを要求します。クラウドコンピューティングとセキュリティレッスンの台頭で

3つの方法生成AIは起業家を増幅します：平均に注意してください！Apr 15, 2025 am 11:33 AM

起業家とAIと生成AIを使用して、ビジネスを改善します。同時に、すべてのテクノロジーと同様に、生成的AIが増幅器であることを覚えておくことが重要です。厳密な2024年の研究o

Andrew Ngによる埋め込みモデルに関する新しいショートコースApr 15, 2025 am 11:32 AM

埋め込みモデルのパワーのロックを解除する：Andrew Ngの新しいコースに深く飛び込むマシンがあなたの質問を完全に正確に理解し、応答する未来を想像してください。これはサイエンスフィクションではありません。 AIの進歩のおかげで、それはRになりつつあります

大規模な言語モデル（LLMS）の幻覚は避けられませんか？Apr 15, 2025 am 11:31 AM

大規模な言語モデル（LLM）と幻覚の避けられない問題 ChatGpt、Claude、GeminiなどのAIモデルを使用した可能性があります。これらはすべて、大規模なテキストデータセットでトレーニングされた大規模な言語モデル（LLMS）、強力なAIシステムの例です。

60％の問題 - AI検索がトラフィックを排出する方法Apr 15, 2025 am 11:28 AM

最近の研究では、AIの概要により、産業と検索の種類に基づいて、オーガニックトラフィックがなんと15〜64％減少する可能性があることが示されています。この根本的な変化により、マーケティング担当者はデジタルの可視性に関する戦略全体を再考することになっています。新しい

AI R＆Dの中心に人間が繁栄するようにするMITメディアラボApr 15, 2025 am 11:26 AM

Elon UniversityがDigital Future Centerを想像している最近のレポートは、300人近くのグローバルテクノロジーの専門家を調査しました。結果のレポート「2035年に人間である」は、ほとんどがTを超えるAIシステムの採用を深めることを懸念していると結論付けました。

See all articles

ホットAIツール

ホットツール

mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。