搜尋
首頁科技週邊人工智慧多路徑多領域通吃! GoogleAI發布多領域學習通用模型MDL

面向視覺任務(如圖像分類)的深度學習模型,通常使用來自單一視覺域(如自然圖像或電腦生成的圖像)的資料進行端到端的訓練。

 一般情況下,一個為多個領域完成視覺任務的應用程式需要為每個單獨的領域建立多個模型,分別獨立訓練,不同領域之間不共享數據,在推理時,每個模型將處理特定領域的輸入資料。 

即使是針對不同領域,這些模型之間的早期層的某些特徵都是相似的,所以,對這些模型進行聯合訓練的效率更高。這能減少延遲和功耗,降低儲存每個模型參數的記憶體成本,這種方法稱為多領域學習(MDL)。

此外,MDL模型也可以優於單領域模型,在一個領域上的額外訓練,可以提高模型在另一個領域上的性能,稱為“正向知識遷移」,但也可能產生負向知識轉移,這取決於訓練方法和特定的領域組合。 雖然先前關於MDL的工作已經證明了跨領域聯合學習任務的有效性,但它涉及到一個手工製作的模型架構,應用於其他工作的效率很低。

多路徑多領域通吃! GoogleAI發布多領域學習通用模型MDL 

#論文連結:https://arxiv.org/pdf/2010.04904.pdf 

為了解決這個問題,在「Multi-path Neural Networks for On-device Multi-domain Visual Classification」一文中,Google研究人員提出了一個通用MDL模型。

文章表示,該模型既可以有效地實現高精確度,減少負向知識遷移的同時,學習增強正向的知識遷移,在處理各種特定領域的困難時,可以有效地優化聯合模型。

多路徑多領域通吃! GoogleAI發布多領域學習通用模型MDL 

為此,研究人員提出了多路徑神經架構搜尋(MPNAS)方法,為多領域建立一個具有異質網路架構的統一模型。 

此方法將高效率的神經結構搜尋(NAS)方法從單路徑搜尋擴展到多路徑搜索,為每個領域共同尋找一條最優路徑。同時引入一個新的損失函數,稱為自適應平衡域優先化(ABDP),它適應特定領域的困難,以幫助有效地訓練模型。由此產生的MPNAS方法是高效且可擴展的。 

新模型在維持表現不下降的同時,與單一領域方法相比,模型大小和FLOPS分別減少了78%和32%。

多路徑神經結構搜尋

為了促進正向知識遷移,避免負向遷移,傳統的解決方案是,建立一個MDL模型,使各領域共享大部分的層,學習各域的共享特徵(稱為特徵提取),然後在上面建造一些特定域的層。 然而,這種特徵提取方法無法處理具有明顯不同特徵的領域(如自然圖像中的物件和藝術繪畫)。另一方面,為每個MDL模型建立統一的異質結構是很耗時的,而且需要特定領域的知識。

多路徑多領域通吃! GoogleAI發布多領域學習通用模型MDL

多路徑神經搜尋架構框架 NAS是一個自動設計深度學習架構的強大範式。它定義了一個搜尋空間,由可能成為最終模型一部分的各種潛在構建塊組成。 

搜尋演算法從搜尋空間中找到最佳的候選架構,以最佳化模型目標,例如分類精確度。最近的NAS方法(如TuNAS)透過使用端到端的路徑採樣,提高了搜尋效率。 

受TuNAS的啟發,MPNAS在兩個階段建立了MDL模型架構:搜尋與訓練。 

#

在搜尋階段,為了給每個領域共同找到一條最佳路徑,MPNAS為每個領域創建了一個單獨的強化學習(RL)控制器,它從超級網路(即由搜尋空間定義的候選節點之間所有可能的子網路的超集)中採樣端到端的路徑(從輸入層到輸出層)。 

在多次迭代中,所有RL控制器更新路徑,以最佳化所有領域的RL獎勵。在搜尋階段結束時,我們為每個領域獲得一個子網路。 最後,所有的子網路被結合起來,為MDL模型建立一個異質結構,如下圖所示。

 多路徑多領域通吃! GoogleAI發布多領域學習通用模型MDL 

#由於每個領域的子網路是獨立搜尋的,所以每一層的構件可以被多個域共享(即深灰色節點),並被單一域使用(即淺灰色節點),或不被任何子網路使用(即點狀節點)。 

每個網域的路徑在搜尋過程中也可以跳過任何一層。鑑於子網路可以以優化性能的方式自由選擇沿路使用的區塊,輸出網路既是異質的又是高效的。 

下圖展示了Visual Domain Decathlon的其中兩個領域的搜尋架構。

 多路徑多領域通吃! GoogleAI發布多領域學習通用模型MDL 

Visual Domain Decathlon是CVPR 2017中的PASCAL in Detail Workshop Challenge的一部分,測試了視覺識別演算法處理(或利用)許多不同視覺領域的能力。 可以看出,這兩個高度相關的域(一個紅色,另一個綠色)的子網,從它們的重疊路徑中共享了大部分構建塊,但它們之間仍然存在差異。

多路徑多領域通吃! GoogleAI發布多領域學習通用模型MDL

圖中紅色和綠色路徑分別代表ImageNet 和Describable Textures的子網絡,深粉紅色節點代表多個域共享的區塊,淺粉紅色節點代表每條路徑使用的區塊。圖中的“dwb”塊代表 dwbottleneck 塊。圖中的Zero區塊表示子網路跳過該區塊 下圖展示了上文提到的兩個領域的路徑相似性。 相似度透過每個領域的子網路之間的Jaccard相似度分數來衡量,其中越高意味著路徑越相似。

 多路徑多領域通吃! GoogleAI發布多領域學習通用模型MDL

圖為十個領域的路徑之間的Jaccard相似度得分的混淆矩陣。分值範圍為0到1,分數越大表示兩條路徑共享的節點越多。 

訓練異質多域模型

在第二階段,MPNAS 產生的模型將針對所有領域從頭開始訓練。 為此,有必要為所有領域定義一個統一的目標函數。 為了成功處理各種各樣的領域,研究人員設計了一種演算法,該演算法在整個學習過程中進行調整,以便在各個領域之間平衡損失,稱為自適應平衡領域優先級 (ABDP)。 下面展示了在不同設定下訓練的模型的準確率、模型大小和FLOPS。我們將MPNAS與其他三種方法進行比較: 

獨立於領域的 NAS:分別為每個領域搜尋和訓練模型。

單路徑多頭:使用預訓練模型作為所有域的共享主幹,每個域都有單獨的分類頭。

多頭 NAS:為所有域搜尋統一的骨幹架構,每個域都有單獨的分類頭。

 從結果中,我們可以觀察到NAS需要為每個領域建立一組模型,從而導致模型很大。 儘管單路徑多頭和多頭NAS可以顯著降低模型大小和FLOPS,但強制域共享相同的主幹會引入負面的知識轉移,從而降低整體準確性。

 多路徑多領域通吃! GoogleAI發布多領域學習通用模型MDL 

相較之下,MPNAS可建立小而有效率的模型,同時仍維持較高的整體精確度。 MPNAS的平均準確率甚至比領域獨立的NAS方法高1.9%,因為該模型能夠實現積極的知識轉移。 下圖比較了這些方法的每個域top-1準確度。

 多路徑多領域通吃! GoogleAI發布多領域學習通用模型MDL 

#評估表明,透過使用ABDP 作為搜尋和訓練階段的一部分,top-1的準確率從69.96% 提高到71.78%(增量: 1.81%)。

‍未來方向

MPNAS是建構異質網路以解決MDL中可能的參數共享策略的資料不平衡、域多樣性、負遷移、域可擴展性和大搜尋空間的有效解決方案。 透過使用類似MobileNet的搜尋空間,產生的模式也對行動裝置友善。 對於與現有搜尋演算法不相容的任務,研究人員正繼續擴展MPNAS用於多任務學習,並希望用MPNAS來建構統一的多域模型。

以上是多路徑多領域通吃! GoogleAI發布多領域學習通用模型MDL的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
烹飪創新:人工智能如何改變食品服務烹飪創新:人工智能如何改變食品服務Apr 12, 2025 pm 12:09 PM

AI增強食物準備 在新生的使用中,AI系統越來越多地用於食品製備中。 AI驅動的機器人在廚房中用於自動化食物準備任務,例如翻轉漢堡,製作披薩或組裝SA

Python名稱空間和可變範圍的綜合指南Python名稱空間和可變範圍的綜合指南Apr 12, 2025 pm 12:00 PM

介紹 了解Python函數中變量的名稱空間,範圍和行為對於有效編寫和避免運行時錯誤或異常至關重要。在本文中,我們將研究各種ASP

視覺語言模型(VLMS)的綜合指南視覺語言模型(VLMS)的綜合指南Apr 12, 2025 am 11:58 AM

介紹 想像一下,穿過​​美術館,周圍是生動的繪畫和雕塑。現在,如果您可以向每一部分提出一個問題並獲得有意義的答案,該怎麼辦?您可能會問:“您在講什麼故事?

聯發科技與kompanio Ultra和Dimenty 9400增強優質陣容聯發科技與kompanio Ultra和Dimenty 9400增強優質陣容Apr 12, 2025 am 11:52 AM

繼續使用產品節奏,本月,Mediatek發表了一系列公告,包括新的Kompanio Ultra和Dimenty 9400。這些產品填補了Mediatek業務中更傳統的部分,其中包括智能手機的芯片

本週在AI:沃爾瑪在時尚趨勢之前設定了時尚趨勢本週在AI:沃爾瑪在時尚趨勢之前設定了時尚趨勢Apr 12, 2025 am 11:51 AM

#1 Google推出了Agent2Agent 故事:現在是星期一早上。作為AI驅動的招聘人員,您更聰明,而不是更努力。您在手機上登錄公司的儀表板。它告訴您三個關鍵角色已被採購,審查和計劃的FO

生成的AI遇到心理摩托車生成的AI遇到心理摩托車Apr 12, 2025 am 11:50 AM

我猜你一定是。 我們似乎都知道,心理障礙由各種chat不休,這些chat不休,這些chat不休,混合了各種心理術語,並且常常是難以理解的或完全荒謬的。您需要做的一切才能噴出fo

原型:科學家將紙變成塑料原型:科學家將紙變成塑料Apr 12, 2025 am 11:49 AM

根據本週發表的一項新研究,只有在2022年製造的塑料中,只有9.5%的塑料是由回收材料製成的。同時,塑料在垃圾填埋場和生態系統中繼續堆積。 但是有幫助。一支恩金團隊

AI分析師的崛起:為什麼這可能是AI革命中最重要的工作AI分析師的崛起:為什麼這可能是AI革命中最重要的工作Apr 12, 2025 am 11:41 AM

我最近與領先的企業分析平台Alteryx首席執行官安迪·麥克米倫(Andy Macmillan)的對話強調了這一在AI革命中的關鍵但不足的作用。正如Macmillan所解釋的那樣,原始業務數據與AI-Ready Informat之間的差距

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
3 週前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
4 週前By尊渡假赌尊渡假赌尊渡假赌

熱工具

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。

WebStorm Mac版

WebStorm Mac版

好用的JavaScript開發工具

SecLists

SecLists

SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

Dreamweaver Mac版

Dreamweaver Mac版

視覺化網頁開發工具

Safe Exam Browser

Safe Exam Browser

Safe Exam Browser是一個安全的瀏覽器環境,安全地進行線上考試。該軟體將任何電腦變成一個安全的工作站。它控制對任何實用工具的訪問,並防止學生使用未經授權的資源。