搜尋
首頁科技週邊人工智慧幾行程式碼穩定UNet ! 中山大學等提出ScaleLong擴散模型:從質疑Scaling到成為Scaling

在標準的UNet結構中,long skip connection上的scaling係數几行代码稳定UNet ! 中山大学等提出ScaleLong扩散模型:从质疑Scaling到成为Scaling一般為1。

然而,在一些著名的擴散模型工作中,例如Imagen,Score-based generative model,以及SR3等等,它們都設定了几行代码稳定UNet ! 中山大学等提出ScaleLong扩散模型:从质疑Scaling到成为Scaling# ,並發現這樣的設定可以有效加速擴散模型的訓練。

几行代码稳定UNet ! 中山大学等提出ScaleLong扩散模型:从质疑Scaling到成为Scaling

几行代码稳定UNet ! 中山大学等提出ScaleLong扩散模型:从质疑Scaling到成为Scaling

几行代码稳定UNet ! 中山大学等提出ScaleLong扩散模型:从质疑Scaling到成为Scaling

#質疑Scaling然而,Imagen等模型對skip connection的Scaling操作在原論文中並沒有具體的分析,只是說這樣設定有助於加速擴散模型的訓練。

首先,這種經驗上的展示,讓我們並搞不清楚到底這種設定發揮了什麼作用?

另外,我們也不清楚是否只能設定几行代码稳定UNet ! 中山大学等提出ScaleLong扩散模型:从质疑Scaling到成为Scaling,還是說可以使用其他的常數?

不同位置的skip connection的「地位」一樣嗎,為什麼要用一樣的常數?

對此,作者有非常多的問號…

几行代码稳定UNet ! 中山大学等提出ScaleLong扩散模型:从质疑Scaling到成为Scaling#圖片

## 理解Scaling

#一般來說,和ResNet以及Transformer結構相比,UNet在實際使用中「深度」並不深,不太容易出現其他「深」神經網路結構常見的梯度消失等優化問題。

另外,由於UNet結構的特殊性,淺層的特徵透過long skip connection與深層的位置相連接,從而進一步避免了梯度消失等問題。

那麼反過來想,這樣的結構如果稍不注意,會不會導致梯度過猛、參數(特徵)由於更新導致震蕩的問題?

几行代码稳定UNet ! 中山大学等提出ScaleLong扩散模型:从质疑Scaling到成为Scaling圖片

透過訓練過程中對擴散模型任務特徵和參數的視覺化,可以發現,確實存在不穩定現象。

參數(特徵)的不穩定,影響了梯度,接著又反過來影響參數更新。最終這個過程對性能有較大的不良幹擾的風險。因此需要想辦法控制這種不穩定性。

進一步的,對於擴散模型。 UNet的輸入是一個帶有雜訊影像,如果要求模型能從中準確預測出加入的噪聲,這需要模型對輸入有強烈的抵禦額外擾動的穩健性。

几行代码稳定UNet ! 中山大学等提出ScaleLong扩散模型:从质疑Scaling到成为Scaling

論文:https://arxiv.org/abs/2310.13545

程式碼:https://github.com/sail-sg /ScaleLong

研究人員發現上述這些問題,可以在Long skip connection上進行Scaling來進行統一地緩解。

几行代码稳定UNet ! 中山大学等提出ScaleLong扩散模型:从质疑Scaling到成为Scaling

從定理3.1來看,中間層特徵的震盪範圍(上下界的寬度)正相關於scaling係數的平方和。適當的scaling係數有助於緩解特徵不穩定。

不過需要注意的是,如果直接讓scaling係數設為0,確實最佳地緩解了震盪。 (手動狗頭)

但是UNet退化為無skip的情況的話,不穩定問題是解決了,但是表徵能力也沒了。這是模型穩定性和表徵能力的trade-off。

几行代码稳定UNet ! 中山大学等提出ScaleLong扩散模型:从质疑Scaling到成为Scaling圖片

類似地,從參數梯度的角度。定理3.3也揭示了scaling係數對梯度量級的控制。

几行代码稳定UNet ! 中山大学等提出ScaleLong扩散模型:从质疑Scaling到成为Scaling圖片

進一步地,定理3.4也揭示了long skip connection上的scaling還可以影響模型對輸入擾動的穩健上界,提升擴散模型對輸入擾動的穩定性。

成為Scaling

#透過上述的分析,我們清楚了Long skip connection上進行scaling對穩定模型訓練的重要性,几行代码稳定UNet ! 中山大学等提出ScaleLong扩散模型:从质疑Scaling到成为Scaling也適用於上述的分析。

接下來,我們將分析怎麼樣的scaling可以有更好的性能,畢竟上述分析只能說明scaling有好處,但不能確定怎麼樣的scaling最好或者較好。

一種簡單的方式是為long skip connection引入可學習的模組來自適應地調整scaling,這種方法稱為Learnable Scaling (LS) Method。我們採用類似SENet的結構,即如下所示(此處考慮的是程式碼整理得非常好的U-ViT結構,讚!)

几行代码稳定UNet ! 中山大学等提出ScaleLong扩散模型:从质疑Scaling到成为Scaling##圖片

#從本文的結果來看,LS確實可以有效地穩定擴散模型的訓練!進一步地,我們嘗試可視化LS中學習到的係數。

如下圖所示,我們會發現這些係數呈現出一種指數下降的趨勢(注意這裡第一個long skip connection是指連接UNet首尾兩端的connection),且第一個係數幾乎接近於1,這個現像也很amazing!

几行代码稳定UNet ! 中山大学等提出ScaleLong扩散模型:从质疑Scaling到成为Scaling圖片

基於這一系列觀察(更多的細節請查閱論文),我們進一步提出了Constant Scaling (CS) Method ,即無需可學習參數的:

几行代码稳定UNet ! 中山大学等提出ScaleLong扩散模型:从质疑Scaling到成为Scaling

CS策略和最初的使用的scaling操作一樣無需額外參數,從而幾乎沒有太多的額外計算消耗。 几行代码稳定UNet ! 中山大学等提出ScaleLong扩散模型:从质疑Scaling到成为Scaling

雖然CS在大多數時候沒有LS在穩定訓練上表現好,不過對於已有的几行代码稳定UNet ! 中山大学等提出ScaleLong扩散模型:从质疑Scaling到成为Scaling策略來說,還是值得一試。

上述CS和LS的實作都非常簡潔,只要若干行程式碼即可。針對各(hua)式(li)各(hu)樣(shao)的UNet結構可能需要對齊一下特徵維度。 (手動狗頭 1)

几行代码稳定UNet ! 中山大学等提出ScaleLong扩散模型:从质疑Scaling到成为Scaling#

最近,一些後續工作,例如FreeU、SCEdit等工作也揭示了skip connection上scaling的重要性,歡迎大家試用和推廣。

#

以上是幾行程式碼穩定UNet ! 中山大學等提出ScaleLong擴散模型:從質疑Scaling到成為Scaling的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
脫衣服免費色情AI工具網站脫衣服免費色情AI工具網站May 13, 2025 am 11:26 AM

https://undressaitool.ai/是功能強大的移動應用程序,具有成人內容的高級AI功能。立即創建AI生成的色情圖像或視頻!

如何使用Undressai創建色情圖像/視頻如何使用Undressai創建色情圖像/視頻May 13, 2025 am 11:26 AM

有關使用distressai創建色情圖片/視頻的教程:1。打開相應的工具Web鏈接; 2。單擊工具按鈕; 3。根據頁面提示上傳所需的生產內容; 4。保存並享受結果。

Undress AI官方網站入口網站地址Undress AI官方網站入口網站地址May 13, 2025 am 11:26 AM

脫衣服AI的官方地址是:https://undressaitool.ai/; undressai是功能強大的移動應用程序,具有成人內容的高級AI功能。立即創建AI生成的色情圖像或視頻!

垂undressai如何產生色情圖像/視頻?垂undressai如何產生色情圖像/視頻?May 13, 2025 am 11:26 AM

有關使用distressai創建色情圖片/視頻的教程:1。打開相應的工具Web鏈接; 2。單擊工具按鈕; 3。根據頁面提示上傳所需的生產內容; 4。保存並享受結果。

垂ipersai色情AI官方網站地址垂ipersai色情AI官方網站地址May 13, 2025 am 11:26 AM

脫衣服AI的官方地址是:https://undressaitool.ai/; undressai是功能強大的移動應用程序,具有成人內容的高級AI功能。立即創建AI生成的色情圖像或視頻!

脫衣舞用法教程指南文章脫衣舞用法教程指南文章May 13, 2025 am 10:43 AM

有關使用distressai創建色情圖片/視頻的教程:1。打開相應的工具Web鏈接; 2。單擊工具按鈕; 3。根據頁面提示上傳所需的生產內容; 4。保存並享受結果。

[帶AI的吉卜力風格圖像]介紹如何使用Chatgpt和版權創建免費圖像[帶AI的吉卜力風格圖像]介紹如何使用Chatgpt和版權創建免費圖像May 13, 2025 am 01:57 AM

OpenAI發布的最新模型GPT-4o,不僅能生成文本,還具備圖像生成功能,引發廣泛關注。其中最受矚目的功能便是“吉卜力風格插畫”的生成。只需將照片上傳至ChatGPT,並給出簡單的指令,即可生成宛如吉卜力工作室作品般夢幻的圖像。本文將詳細解讀實際操作流程、效果感受,以及需要注意的錯誤和版權問題。 OpenAI發布的最新模型“o3”詳情請點擊此處⬇️ OpenAI o3(ChatGPT o3)詳解:特性、定價體系及o4-mini介紹 吉卜力風格文章的英文版請點擊此處⬇️ 利用ChatGPT創作吉

解釋在地方政府中使用和實施CANTGPT的示例!還介紹了禁止的地方政府解釋在地方政府中使用和實施CANTGPT的示例!還介紹了禁止的地方政府May 13, 2025 am 01:53 AM

作為一種新的交流方法,在地方政府中使用和引入Chatgpt引起了人們的關注。儘管這種趨勢在廣泛的領域正在發展,但一些地方政府拒絕使用Chatgpt。 在本文中,我們將介紹地方政府中ChatGPT實施的示例。我們將通過各種改革實例,包括支持文件創建和與公民對話,從而探索如何通過各種改革實例來實現地方政府服務的質量和效率提高。 不僅旨在減少員工工作量並改善公民的便利性的地方政府官員,而且都對高級用例感興趣。

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

EditPlus 中文破解版

EditPlus 中文破解版

體積小,語法高亮,不支援程式碼提示功能

PhpStorm Mac 版本

PhpStorm Mac 版本

最新(2018.2.1 )專業的PHP整合開發工具

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版

WebStorm Mac版

WebStorm Mac版

好用的JavaScript開發工具

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

強大的PHP整合開發環境