華為海思加拿大研究院和阿爾伯塔大學聯合推出了一個基於預訓練和知識注入的神經網路效能預測框架。
神經網路的效能評估 (精確度、召回率、PSNR 等) 需要大量的資源和時間,是神經網路結構搜尋(NAS)的主要瓶頸。早期的 NAS 方法需要大量的資源來從零訓練每一個搜尋到的新結構。近幾年來,網路效能預測器作為一種高效的效能評估方法正在引起更多關注。
然而,目前的預測器在使用範圍上受限,因為它們只能建模來自特定搜尋空間的網路結構,並且只能預測新結構在特定任務上的效能。例如,訓練樣本只包含分類網路以及它們的精確度,這樣訓練出來的預測器只能用於評估新網路結構在影像分類任務上的效能。
為了打破這一邊界,使預測器能夠預測某一網絡結構在多種任務上的性能,具備跨任務跨數據泛化能力,華為海思加拿大研究院和阿爾伯塔大學聯合推出了一個基於預訓練和知識注入的神經網路性能預測框架。此框架可快速評估不同結構和種類的網路在分類、偵測、分割等多種不同類型 CV 任務上的效能,以用於神經網路結構搜尋。研究論文已被 AAAI 2023 接收。
- 論文連結:https://arxiv.org/abs/2211.17228
- 程式碼連結:https://github.com/Ascend -Research/AIO-P
AIO-P(All-in-One Predictors)方法旨在將神經預測器的範圍擴展到分類之外的電腦視覺任務。 AIO-P 利用 K-Adapter 技術將任務相關的知識注入預測器模型,同時設計了一個基於 FLOPs(浮點操作數)的標籤縮放機制來適應不同的效能指標和分佈。 AIO-P 使用了一種獨特的偽標記方案來訓練 K-Adapters,只需幾分鐘即可產生新的訓練樣本。實驗結果表明,AIO-P 展示了強大的性能預測能力,在幾個電腦視覺任務上都取得了出色的 MAE 和 SRCC 結果。此外,AIO-P 可以直接遷移並預測從未見過的網路結構的效能,可以與 NAS 配合,在保證效能不降低的前提下優化現有網路的運算量。
方法介紹
AIO-P 是一種可泛化於多任務的通用網路效能預測器。 AIO-P 透過預測器預訓練和特定領域知識注入實現了跨任務和跨搜尋空間的效能預測能力。 AIO-P 利用K-Adapter 技術將任務相關的知識注入預測器,同時依賴通用的計算圖(CG)格式表示一個網絡結構,最終使其能夠支援來自不同搜尋空間和任務的網絡,如下圖1所示。
圖1. AIO-P 是如何表示用於不同任務的網路結構的
此外,偽標記機制的運用使AIO-P 能夠快速產生新的訓練樣本用來訓練K-Adapters。為了彌合不同任務上效能度量範圍之間的差距,AIO-P 提出了一種基於 FLOPs 的標籤縮放方法,實現了跨任務效能建模。廣泛的實驗結果表明,AIO-P 能夠在各種不同的 CV 任務上進行準確的表現預測,如姿勢估計和分割,無需訓練樣本或僅需少量微調。此外,AIO-P 可以正確地對從未見過的網絡結構進行性能排序,與搜索演算法結合後用於優化華為面部識別網絡,保持其性能不變並將 FLOPs 降低超過 13.5%。論文已被 AAAI-23 接收並且程式碼已經在 GitHub 上開源。
電腦視覺網路通常由執行特徵提取的 “主幹” 和使用提取到的特徵進行預測的 “頭部” 組成。 「主幹」 的結構通常是基於某一種已知的網路結構設計的(ResNet, Inception, MobileNet, ViT, UNet),而「頭部」 是針對給定任務,如分類、姿態估計、分割等而設計的。傳統的 NAS 方案會根據 「主幹」 的結構手動自訂搜尋空間,例如已知 「主幹」 是 MobileNetV3,那麼搜尋空間可能包含 MBConv Block 數目,每個 MBConv 的參數 (kernel size, expansion),通道數等。然而這種客製化的搜尋空間不具備通用性,如果有另一個 「主幹」 是基於 ResNet 設計的,則無法透過現有的 NAS 框架來優化它,而是需要重新設計搜尋空間。
為了解決這個問題,AIO-P 選擇了從計算圖層面來表示不同的網路結構,實現了對任何網路結構的統一表示。具體如圖 2 所示,計算圖格式允許 AIO-P 將頭部和主幹編碼在一起來表示整網結構。這也使得 AIO-P 可以預測來自不同搜尋空間(如 MobileNets 和 ResNets)的網路在各種任務上的效能。
圖2. MobileNetV3 中的Squeeze-and-Excite 模組在計算圖層面的表示
AIO-P 中提出的預測器結構從單一GNN 迴歸模型開始(圖3,綠色區塊),它可以預測影像分類網路的效能。為了在它的基礎上加入其他 CV 任務的知識,例如偵測或分割,研究將一個 K-Adapter(圖 3,橘色區塊)附加到原始迴歸模型上。 K-Adapter 在新任務的樣本上進行訓練,而原始模型權重則被凍結。因此,研究單獨訓練多個 K-Adapter(圖 4)來加入來自多個任務的知識。
圖3. 擁有一個K-Adapter 的AIO-P 預測器
圖4. 擁有多個K-Adapter 的AIO-P 預測器
#為了進一步降低訓練每個K-Adapter 的開銷,該研究提出了一種巧妙的偽標籤技術。這項技術使用 Latent 採樣的方案來訓練能共享於不同任務間的 “頭部” 模型。共享頭部訓練之後可以與搜尋空間中的任何網路主幹配對,並在 10-15 分鐘內進行微調以產生偽標籤(圖 5)。
圖5. 訓練能共享於不同任務間的「頭部」 模型
經實驗證明,使用共享頭部所獲得的偽標籤與透過從零開始訓練一個網路一天或更長時間所獲得的實際效能呈正相關,有時排序相關度係數超過0.5 (Spearman correlation)。
除此之外,不同的任務會有不同的效能指標。這些效能指標通常有自己特定的分佈區間,例如,使用了某一特定主幹的分類網路在ImageNet 上分類準確率可能約為75%,而在MS-COCO 物體檢測任務上的mAP 可能為30-35 %。為了考慮這些不同的區間,研究基於標準化概念提出了一種從常態分佈中理解網路效能的方法。通俗的說,如果預測值為0,則該網絡性能為平均值;如果> 0,則為較優網絡;
圖6. 如何標準化網路效能
網路的FLOPs 與模型大小,輸入資料相關,並且通常與效能呈正相關趨勢。該研究使用 FLOPs 轉換來增強 AIO-P 從中學習的標籤。
實驗及結果
該研究首先在人體姿態估計和物體檢測任務上上訓練AIO-P,然後用它預測多種任務上網絡結構的性能,包括姿態估計( LSP 和MPII),偵測(OD),實例分割(IS),語意分割(SS)和全景分割(PS)。即使在零樣本直接遷移的情況下,使用AIO-P 對來自於Once-for-All(OFA)搜尋空間(ProxylessNAS,MobileNetV3 和ResNet-50)的網路在這些任務上的效能進行預測,最終預測結果達到了低於1.0%的MAE 和超過0.5 的排序相關度。
此外,研究也使用AIO-P 預測了TensorFlow-Slim 開源模型庫中的網路的效能(例如DeepLab 語意分割模型,ResNets,Inception nets,MobileNets和EfficientNets),這些網路結構可能未曾在AIO-P 的訓練樣本中出現。
AIO-P 透過利用FLOPs 轉換,在3 個DeepLab 語意分割模型庫上能夠實現幾乎完美的SRCC,同時在所有4 個分類模型庫上獲得正的SRCC,以及在EfficientNet 模型上實現SRCC=1.0 。
最後,AIO-P 的核心動機是能夠將其與搜尋演算法配對,並將其用於優化任意網路結構,可以是獨立的,不屬於任何搜尋空間或已知模型庫的結構,甚至可以是一個用於從未訓練過的任務的結構。該研究使用AIO-P 和隨機變異搜尋演算法來優化華為手機上使用的人臉辨識(FR)模型,結果顯示 AIO-P 能夠在降低模型計算量FLOPs 超過13.5%的同時保持性能(精度(Pr)和召回率(Rc))。
有興趣的讀者可以閱讀論文原文,了解更多研究細節。
以上是打破NAS瓶頸,新方法AIO-P跨任務預測架構效能的詳細內容。更多資訊請關注PHP中文網其他相關文章!

译者 | 布加迪审校 | 孙淑娟目前,没有用于构建和管理机器学习(ML)应用程序的标准实践。机器学习项目组织得不好,缺乏可重复性,而且从长远来看容易彻底失败。因此,我们需要一套流程来帮助自己在整个机器学习生命周期中保持质量、可持续性、稳健性和成本管理。图1. 机器学习开发生命周期流程使用质量保证方法开发机器学习应用程序的跨行业标准流程(CRISP-ML(Q))是CRISP-DM的升级版,以确保机器学习产品的质量。CRISP-ML(Q)有六个单独的阶段:1. 业务和数据理解2. 数据准备3. 模型

thinkphp是国产框架。ThinkPHP是一个快速、兼容而且简单的轻量级国产PHP开发框架,是为了简化企业级应用开发和敏捷WEB应用开发而诞生的。ThinkPHP从诞生以来一直秉承简洁实用的设计原则,在保持出色的性能和至简的代码的同时,也注重易用性。

什么是 celery这次我们来介绍一下 Python 的一个第三方模块 celery,那么 celery 是什么呢? celery 是一个灵活且可靠的,处理大量消息的分布式系统,可以在多个节点之间处理某个任务; celery 是一个专注于实时处理的任务队列,支持任务调度; celery 是开源的,有很多的使用者; celery 完全基于 Python 语言编写;所以 celery 本质上就是一个任务调度框架,类似于 Apache 的 airflow,当然 airflow 也是基于 Python

AI就像一个黑匣子,能自己做出决定,但是人们并不清楚其中缘由。建立一个AI模型,输入数据,然后再输出结果,但有一个问题就是我们不能解释AI为何会得出这样的结论。需要了解AI如何得出某个结论背后的原因,而不是仅仅接受一个在没有上下文或解释的情况下输出的结果。可解释性旨在帮助人们理解:如何学习的?学到了什么?针对一个特定输入为什么会做出如此决策?决策是否可靠?在本文中,我将介绍6个用于可解释性的Python框架。SHAPSHapleyAdditiveexplanation(SHapleyAdditi

AOP(面向切面编程)是一种编程思想,用于解耦业务逻辑和横切关注点(如日志、权限等)。在PHP中,使用AOP框架可以简化编码,提高代码可维护性和可扩展性。本文将介绍在PHP中使用AOP框架的基本原理和实现方法。一、AOP的概念和原理面向切面编程,指的是将程序的业务逻辑和横切关注点分离开来,通过AOP框架来实现统一管理。横切关注点指的是在程序中需要重复出现并且

已安装Microsoft.NET版本4.5.2、4.6或4.6.1的MicrosoftWindows用户如果希望Microsoft将来通过产品更新支持该框架,则必须安装较新版本的Microsoft框架。据微软称,这三个框架都将在2022年4月26日停止支持。支持日期结束后,产品将不会收到“安全修复或技术支持”。大多数家庭设备通过Windows更新保持最新。这些设备已经安装了较新版本的框架,例如.NETFramework4.8。未自动更新的设备可能

如果你在Windows11上安装了2022年5月累积更新,你可能已经注意到你一直使用的许多应用程序都不像以前那样工作了。强制性安全更新KB5013943正在使某些使用.NET框架的应用程序崩溃。在某些情况下,用户会收到错误代码:0xc0000135。可选更新中报告了类似的问题,但并不普遍。随着2022年5月的更新,该错误似乎已进入生产渠道,这次有更多用户受到影响。崩溃在使用.NETFramework的应用程序中很常见,Discord或MicrosoftTeams等

近几年人工智能领域的突破大多由自监督学习推动,比如BERT中提出的MLM(MaskedLanguageModel),通过将文本中的部分单词遮盖后重新预测,使得海量无标记文本数据也能用来训练模型,自此开启了大规模预训练模型的新时代。但自监督学习算法也有明显的局限性,通常只适用于单一模态(如图像、文本、语音等)的数据,并且需要大量的算力从海量数据中进行学习。相比之下,人类的学习效率要显著高于当前的AI模型,并且可以从不同类型的数据中进行学习。2022年1月,MetaAI发布了自监督学习框架data2


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

DVWA
Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中

PhpStorm Mac 版本
最新(2018.2.1 )專業的PHP整合開發工具

Atom編輯器mac版下載
最受歡迎的的開源編輯器

MinGW - Minimalist GNU for Windows
這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。