検索
ホームページテクノロジー周辺機器AIMicrosoft、ワンストップで高性能軽量モデルを取得できる自動ニューラルネットワークトレーニングプルーニングフレームワーク「OTO」を提案

OTO は、業界初の自動化されたワンストップのユーザーフレンドリーで多用途なニューラル ネットワーク トレーニングおよび構造圧縮フレームワークです。

人工知能の時代では、ニューラル ネットワークをどのように展開して維持するかが製品化の重要な課題です。モデルのパフォーマンスの損失を可能な限り最小限に抑えながらコンピューティング コストを節約するために、ニューラル ネットワークを圧縮することが重要になっています。 DNN を製品化するための鍵の 1 つ。

Microsoft、ワンストップで高性能軽量モデルを取得できる自動ニューラルネットワークトレーニングプルーニングフレームワーク「OTO」を提案

#DNN 圧縮には一般に、枝刈り、知識蒸留、量子化という 3 つの方法があります。プルーニングは、モデルのパフォーマンスを可能な限り維持しながら、冗長な構造を特定して削除し、DNN をスリム化することを目的とした、最も汎用性が高く効果的な圧縮方法です。一般に、3 つの方法は相互に補完し合い、連携して最高の圧縮効果を実現できます。

Microsoft、ワンストップで高性能軽量モデルを取得できる自動ニューラルネットワークトレーニングプルーニングフレームワーク「OTO」を提案

ただし、既存のプルーニング手法のほとんどは、特定のモデルと特定のタスクのみを対象としており、専門分野の強力な知識が必要であるため、通常、AI 開発者は多大なエネルギーを費やす必要があります。これらの方法を独自のシナリオに適用すると、多くの人的資源と物的リソースが消費されます。

OTO の概要

既存のプルーニング手法の問題を解決し、AI 開発者に利便性を提供するために、Microsoft チームは Only-Train-Once OTO フレームワークを提案しました。 OTO は、業界初の自動化されたワンストップのユーザーフレンドリーでユニバーサルなニューラル ネットワーク トレーニングおよび構造圧縮フレームワークであり、一連の成果が ICLR2023 および NeurIPS2021 で公開されています。

OTO を使用することで、AI エンジニアはターゲットのニューラル ネットワークを簡単にトレーニングし、高性能かつ軽量なモデルをワンストップで取得できます。 OTO は、開発者のエンジニアリング時間と労力への投資を最小限に抑え、既存の方法で通常必要となる時間のかかる事前トレーニングや追加のモデル微調整を必要としません。

  • 論文リンク:
  • OTOv2 ICLR 2023: https://openreview.net/pdf?id=7ynoX1ojPMt
  • OTOv1 NeurIPS 2021: https://proceedings .neurips.cc/paper_files/paper/2021/file/a376033f78e144f494bfc743c0be3330-Paper.pdf
  • コードリンク:
    https://github.com/tianyic/only_train_once
フレームワーク コア アルゴリズム

理想的な構造枝刈りアルゴリズムは、一般的なニューラル ネットワークをワンストップでゼロから自動的にトレーニングしながら、フォローアップの微調整を必要とせずに、高性能で軽量なモデルを実現できる必要があります。しかし、ニューラル ネットワークは複雑であるため、この目標を達成することは非常に困難です。この最終目標を達成するには、次の 3 つの主要な質問に系統的に対処する必要があります:

    どのネットワーク構造を削除できるかを確認するにはどうすればよいですか?
  • モデルのパフォーマンスをできるだけ失わずにネットワーク構造を削除するにはどうすればよいでしょうか?
  • 上記の 2 つの点を自動的に達成するにはどうすればよいでしょうか?
Microsoft チームは、3 セットのコア アルゴリズムを設計および実装し、これら 3 つのコア問題を初めて体系的かつ包括的に解決しました。

自動化されたゼロ不変グループ (ゼロ不変グループ) のグループ化

ネットワーク構造の複雑さと相関関係により、ネットワーク構造を削除するとネットワークが残る可能性があります。構造が無効です。したがって、自動ネットワーク構造圧縮における最大の問題の 1 つは、残りのネットワークが引き続き有効になるように一緒に枝刈りする必要があるモデル パラメーターをどのように見つけるかということです。この問題を解決するために、Microsoft チームは OTOv1 でゼロ不変グループ (ZIG) を提案しました。ゼロ不変グループは、グループの対応するネットワーク構造が削除された後も、残りのネットワークが引き続き有効であるように、削除可能な最小単位の一種として理解できます。ゼロ不変グループのもう 1 つの優れた特性は、ゼロ不変グループがゼロに等しい場合、入力値が何であっても、出力値は常にゼロになることです。 OTOv2 では、研究者らはさらに、一般ネットワークにおけるゼロ不変グループのグループ化問題を解決するための一連の自動化アルゴリズムを提案および実装しました。自動グループ化アルゴリズムは、一連のグラフ アルゴリズムを慎重に組み合わせて設計されており、アルゴリズム全体が非常に効率的で、時間と空間の複雑さが線形になります。

Microsoft、ワンストップで高性能軽量モデルを取得できる自動ニューラルネットワークトレーニングプルーニングフレームワーク「OTO」を提案

二重半平面投影勾配最適化アルゴリズム (DHSPG)

ターゲット ネットワークのすべてのゼロ不変グループを分割した後、次のモデルのトレーニングおよび枝刈りタスクでは、どのゼロ不変グループが冗長で、どのグループが重要であるかを特定する必要があります。圧縮モデルのパフォーマンスを確保するには、冗長なゼロ不変グループに対応するネットワーク構造を削除する必要がありますが、重要なゼロ不変グループは保持する必要があります。研究者らは、この問題を構造的スパース化問題として定式化し、それを解決するための新しいデュアル半空間投影勾配 (DHSPG) 最適化アルゴリズムを提案しました。

Microsoft、ワンストップで高性能軽量モデルを取得できる自動ニューラルネットワークトレーニングプルーニングフレームワーク「OTO」を提案

DHSPG は、冗長なゼロ不変式グループを非常に効果的に見つけてゼロに投影し、重要なゼロ不変式グループを継続的にトレーニングして、元のモデルと同等のパフォーマンスを達成できます。

従来のスパース最適化アルゴリズムと比較して、DHSPG はより強力で安定したスパース構造探索機能を備え、トレーニング検索スペースを拡大するため、通常はより高い実際のパフォーマンス結果が得られます。

Microsoft、ワンストップで高性能軽量モデルを取得できる自動ニューラルネットワークトレーニングプルーニングフレームワーク「OTO」を提案

軽量圧縮モデルを自動的に構築する

DHSPG を使用してモデルをトレーニングすると、ゼロ不変 A ソリューションが得られます。グループの構造的疎性が高い、つまり、ゼロに射影される多くのゼロ不変グループを含む解は、モデルのパフォーマンスも高くなります。次に、研究者らは、圧縮ネットワークを自動的に構築するために、冗長なゼロ不変グループに対応するすべての構造を削除しました。ゼロ不変グループの特性により、つまり、ゼロ不変グループがゼロに等しい場合、入力値が何であっても、出力値は常にゼロになるため、冗長なゼロ不変グループを削除しても、ネットワークに影響を与える可能性があります。したがって、OTO を通じて取得された圧縮ネットワークは、従来の方法で必要とされたモデルのさらなる微調整を必要とせずに、完全なネットワークと同じ出力を持ちます。

数値実験

分類タスク

Microsoft、ワンストップで高性能軽量モデルを取得できる自動ニューラルネットワークトレーニングプルーニングフレームワーク「OTO」を提案

##表 1: CIFAR10 BN モデルの VGG16 および VGG16-パフォーマンス

CIFAR10 の VGG16 実験では、OTO は浮動小数点数を 86.6%、パラメータ数を 97.5% 削減し、そのパフォーマンスは印象的でした。

Microsoft、ワンストップで高性能軽量モデルを取得できる自動ニューラルネットワークトレーニングプルーニングフレームワーク「OTO」を提案

#表 2: CIFAR10 の ResNet50 実験

CIFAR10 の ResNet50 実験では、量子化なしで OTO が優れたパフォーマンスを発揮 SOTA ニューラル ネットワーク圧縮フレームワーク AMC と ANNC は、FLOP の 7.8% とパラメータの 4.1% のみを使用します。

Microsoft、ワンストップで高性能軽量モデルを取得できる自動ニューラルネットワークトレーニングプルーニングフレームワーク「OTO」を提案#表 3. ImageNet の ResNet50 実験

ImageNet の ResNet50 実験では、さまざまな構造的疎性ターゲットの下での OTOv2 のパフォーマンスが示されています。既存の SOTA メソッドと同等かそれ以上です。

Microsoft、ワンストップで高性能軽量モデルを取得できる自動ニューラルネットワークトレーニングプルーニングフレームワーク「OTO」を提案表 4: より多くの構造とデータ セット

OTO はさらに多くのデータ セットとモデル構造を実現しました。悪くないパフォーマンスです。

低レベル視覚タスク

Microsoft、ワンストップで高性能軽量モデルを取得できる自動ニューラルネットワークトレーニングプルーニングフレームワーク「OTO」を提案表 4: CARNx2

の実験超解像タスクでは、OTOワンストップトレーニングによりCARNx2ネットワークを圧縮し、オリジナルモデルと同等の性能を達成し、計算量とモデルサイズを75%以上圧縮しました。

言語モデル タスク

#さらに、研究者らは、Bert のコア アルゴリズムの 1 つである DHSPG 最適化アルゴリズムも実行しました。比較実験により、他のスパース最適化アルゴリズムと比較してその高いパフォーマンスが検証されます。 Squad では、トレーニングに DHSPG を使用することで得られるパラメーター削減とモデルのパフォーマンスが、他のスパース最適化アルゴリズムよりもはるかに優れていることがわかります。 Microsoft、ワンストップで高性能軽量モデルを取得できる自動ニューラルネットワークトレーニングプルーニングフレームワーク「OTO」を提案

結論

Microsoft チームは、OTO (Only-Train-Once) と呼ばれる、自動化されたワンストップ ニューラル ネットワーク トレーニング構造プルーニング フレームワークを提案しました。高いパフォーマンスを維持しながら、完全なニューラル ネットワークを軽量ネットワークに自動的に圧縮できます。 OTO は、既存の構造プルーニング手法の複雑な多段階プロセスを大幅に簡素化し、さまざまなネットワーク アーキテクチャとアプリケーションに適しており、ユーザーの追加のエンジニアリング投資を最小限に抑え、多用途で効果的で使いやすいです。

以上がMicrosoft、ワンストップで高性能軽量モデルを取得できる自動ニューラルネットワークトレーニングプルーニングフレームワーク「OTO」を提案の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。
敬意を表した技術:AIおよび先住民のコミュニティパワー敬意を表した技術:AIおよび先住民のコミュニティパワーApr 18, 2025 am 11:21 AM

答えは複雑です。 AIは、先住民族の自己決定、言語保存、気候管理をサポートする非常に大きな可能性を抱えています。しかし、それはまた、消去、搾取、除外の長年のパターンを深める危険を冒します - それがそうでない限り

デジタル製品エクスペリエンスに対する仮想AIエージェントの影響デジタル製品エクスペリエンスに対する仮想AIエージェントの影響Apr 18, 2025 am 11:13 AM

カスタマーサービスの革新:統合情報システムにおける仮想AIエージェントの台頭 今日の急速に進化するデジタル環境では、企業は顧客コミュニケーションを強化するための革新的な方法を常に求めています。 の統合

Google Guilty Again、Meta on Trial、Openai Social、IRロールアップタッチキャストAIGoogle Guilty Again、Meta on Trial、Openai Social、IRロールアップタッチキャストAIApr 18, 2025 am 11:10 AM

2025年4月17日、米国地区裁判官のレオニー・ブリンケマは、Googleがデジタル広告市場の重要なセグメントを違法に独占していると裁定しました。裁判所は、Googleが出版社の広告サーバーと広告交換を結びつけることでその支配を乱用したと判断しました。

AVバイト:SearchGpt、Llama 3.1などをフィーチャーした毎週のAIイノベーションAVバイト:SearchGpt、Llama 3.1などをフィーチャーした毎週のAIイノベーションApr 18, 2025 am 11:06 AM

今週、AIの分野での大きなブレークスルー! AVバイトは、AIフィールドで最新の進歩をもたらします。興奮は見逃せません!検索エンジンの未来? OpenaiのSearchGpt、Meta's Llama 3.1、およびMistral AIの大きな2モデルはすべて、すべてAIを新たな高みに押し上げます。さらに、AIは数学オリンピアードでメダルを獲得し、医療診断の分野で人間の医師を超えた可能性を示しました。これはすべて、サイエンスフィクションが徐々に現実になっていることを示しています! 今週のハイライト: OpenaiのSearchGpt:高度な自然言語処理テクノロジーを使用して情報検索効率を向上させる新しい検索エンジンプロトタイプ。 メタのllama 3.1:embrace

迅速なエンジニアリングの密度の連鎖は何ですか? - 分析Vidhya迅速なエンジニアリングの密度の連鎖は何ですか? - 分析VidhyaApr 18, 2025 am 11:04 AM

プロンプトエンジニアリングで密度チェーンをマスターする:簡潔で効果的なプロンプトを作成する 自然言語処理(NLP)と人工知能では、迅速なエンジニアリングのマスタリングが重要になっています。このスキルは科学と芸術を組み合わせており、AIモデルをガイドして目的の結果を生成するための正確な指示を慎重に設計することが含まれます。多くの技術の中で、密度の連鎖は、簡潔で効果的なヒントを作成する強力な方法として際立っています。この記事では、TIPSエンジニアリングにおける密度チェーンの概念、およびAI駆動型コンテンツ作成におけるそれらの重要性を深く探ります。 概要 エンジニアリングにおける密度チェーン法に関するヒントは、NLPおよびAIで非常に重要です。 関連情報を圧縮して追加することにより、幅広い要約を繰り返し改善します。

ElevenLabs API:音声合成、クローニングなどのガイドElevenLabs API:音声合成、クローニングなどのガイドApr 18, 2025 am 10:59 AM

ElevenLabs:AIを使用した音声合成の革命 テキストを、ElevenLabsの最先端のAI音声合成とオーディオソリューションで簡単に魅惑的な声に変換します。 このガイドでは、ElevenLabsの主要な機能を調査し、実用的なAPIデモを提供します

VGG16およびFAISによる効率的な画像の類似性検索の構築VGG16およびFAISによる効率的な画像の類似性検索の構築Apr 18, 2025 am 10:56 AM

迅速な画像検索:VGG16とFAISSを使用して高速類似性検索システムの構築 数え切れないほどの写真を手動で検索して特定の画像を見つけることを想像してみてください。 この記事では、解決策を探ります。稲妻の構築

Flame Guardian:ディープラーニングベースの火災検出システムFlame Guardian:ディープラーニングベースの火災検出システムApr 18, 2025 am 10:54 AM

導入 あなたがあなたの家族の安全を確保するので、煙の匂い、心臓のレースに目覚めることを想像してください。早期発見は非常に重要であり、深い学習駆動の火災検出システムである「Flame Guardian」は、

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

Dreamweaver Mac版

Dreamweaver Mac版

ビジュアル Web 開発ツール

PhpStorm Mac バージョン

PhpStorm Mac バージョン

最新(2018.2.1)のプロフェッショナル向けPHP統合開発ツール

MantisBT

MantisBT

Mantis は、製品の欠陥追跡を支援するために設計された、導入が簡単な Web ベースの欠陥追跡ツールです。 PHP、MySQL、Web サーバーが必要です。デモおよびホスティング サービスをチェックしてください。

SAP NetWeaver Server Adapter for Eclipse

SAP NetWeaver Server Adapter for Eclipse

Eclipse を SAP NetWeaver アプリケーション サーバーと統合します。

WebStorm Mac版

WebStorm Mac版

便利なJavaScript開発ツール