搜尋
首頁科技週邊人工智慧OpenAI新生成模式開源炸場!比Diffusion更快更強,清華校友宋颯一作

影像生成領域,看來又要變天了。

就在剛剛,OpenAI開源了比擴散模型更快、性能更好的一致性模型:

#無需對抗訓練,就能生成高品質圖片!

這個重磅消息一經發出,立刻引爆學術圈。

OpenAI新生成模式開源炸場!比Diffusion更快更強,清華校友宋颯一作

雖說論文本身在3月份就已低調發布,但當時大夥兒普遍認為它只是個OpenAI的前沿研究,並不會真正將細節公開。

OpenAI新生成模式開源炸場!比Diffusion更快更強,清華校友宋颯一作

沒想到這次直接來了個開源。有網友立刻上手實測了一波效果,發現只需要3.5秒左右就能生成64張左右256×256的影像:

##遊戲結束!

OpenAI新生成模式開源炸場!比Diffusion更快更強,清華校友宋颯一作

這是這位網友產生的圖像效果,看起來還不錯:

OpenAI新生成模式開源炸場!比Diffusion更快更強,清華校友宋颯一作

還有網友調侃:這次OpenAI終於Open了!

OpenAI新生成模式開源炸場!比Diffusion更快更強,清華校友宋颯一作

值得一提的是,論文一作OpenAI科學家宋颮,是一位清華校友,16歲就透過領導計畫進入清華數理基礎科學班求學。

一起來看看這次OpenAI開源了一項怎樣的​​研究。

開源了一個怎樣的重磅研究?

作為一個影像產生AI,一致性模型(Consistency Model)最大的特點在於快又好。

相比擴散模型,它主要有兩大優點:

其一,無需對抗訓練(adversarial training),就能直接生成高品質的影像樣本。

其二,相較於擴散模型可能需要數百甚至上千次迭代,一致性模型只需要一兩步驟就能搞定多種影像任務-

#包括上色、去雜訊、超分等,都可以在幾步之內搞定,而不需要對這些任務進行明確訓練。 (當然,如果進行少樣本學習的話,生成效果也會更好)

OpenAI新生成模式開源炸場!比Diffusion更快更強,清華校友宋颯一作

#所以一致性模型究竟是如何實現這種效果的?

從原理來看,一致性模型的誕生與ODE(常微分方程)式產生擴散模型有關。

圖中可見,ODE會先一步步將圖片資料轉換成噪聲,隨後再進行一個逆向求解,從噪聲中學習生成影像。

而就在這個過程中,作者們試圖將ODE軌跡上的任何點(如Xt、Xt和Xr)映射到它的原點(如X0)進行生成建模。

隨後,這個映射的模型被命名為一致性模型,因為它們的輸出都是同一軌跡上的同一點:

OpenAI新生成模式開源炸場!比Diffusion更快更強,清華校友宋颯一作##基於這種思路,一致性模型不需要再經過漫長的迭代,才能產生一個相對品質比較高的影像,而是能做到一步生成。

下圖是一致性模型(CD)和擴散模型(PD)在影像生成指標FID上的對比。

其中,PD是去年史丹佛和Google大腦提出的一種最新擴散模型方法漸進式蒸餾(progressive distillation)的簡稱,CD(consistency distillation)則是一致性蒸餾方法。

可以看出,幾乎在所有資料集上,一致性模型的影像產生效果都要比擴散模型更好,唯一的例外是256×256的房間資料集上:

OpenAI新生成模式開源炸場!比Diffusion更快更強,清華校友宋颯一作除此之外,作者們也將擴散模型、一致性模型和GAN等模型在其他各種資料集上進行了對比:

OpenAI新生成模式開源炸場!比Diffusion更快更強,清華校友宋颯一作

不過也有網友提到,這次開源的AI一致性模型,能產生的圖像還是太小:

很難過,這次開源的版本生成的圖像還是太小了,如果能給出生成更大圖像的開源版本,肯定會非常讓人興奮。

OpenAI新生成模式開源炸場!比Diffusion更快更強,清華校友宋颯一作

也有網友猜測,可能只是OpenAI還沒訓練出來。不過可能訓練出來了我們也不一定能搞到程式碼(手動狗頭)。

不過對於這項工作的意義,TechCrunch表示:

你若是有一堆GPU,那用擴散模型在一兩分鐘內迭代1500多次,生成圖片的效果當然是極好的。

但如果你想在手機上或聊天對話的時候即時產生圖片,那顯然擴散模型不是最好的選擇。

一致性模型是OpenAI下一個重要動作。

期待OpenAI會開源一波解析度更高的圖像生成AI~

清華校友宋颮一作

論文一作宋颯,目前是OpenAI的研究科學家。

OpenAI新生成模式開源炸場!比Diffusion更快更強,清華校友宋颯一作

他14歲時,曾以17位評審全票通過的成績,入選「清華大學新百年領軍計畫」。在隔年高考中,他又成為連雲港市理科狀元,順利考入清華。

2016年,宋颯從清華大學數理基礎科學班畢業,此後赴史丹佛深造。 2022年,宋颮獲史丹佛電腦科學博士學位,而後加入OpenAI。

在博士期間,他的一作論文「Score-Based Generative Modeling through Stochastic Differential Equations」也獲得過ICLR 2021的傑出論文獎。

OpenAI新生成模式開源炸場!比Diffusion更快更強,清華校友宋颯一作

根據其個人主頁信息,從2024年1月開始,宋颮將正式加入加州理工學院電子系和計算數學科學系,擔任助理教授。

專案地址:
##https://www.php.cn/link/4845b84d63ea5fa8df6268b8d1616a8f

#論文地址:


##論文地址:

https://www.php.cn/link/5f25fbe144e4a81a1b0080b6c1032778#########參考連結:###[1]https://twitter.com/alfredplpl/status/1646217811898 ###[2]https://twitter.com/_akhaliq/status/1646168119658831874###

以上是OpenAI新生成模式開源炸場!比Diffusion更快更強,清華校友宋颯一作的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
在LLMS中調用工具在LLMS中調用工具Apr 14, 2025 am 11:28 AM

大型語言模型(LLMS)的流行激增,工具稱呼功能極大地擴展了其功能,而不是簡單的文本生成。 現在,LLM可以處理複雜的自動化任務,例如Dynamic UI創建和自主a

多動症遊戲,健康工具和AI聊天機器人如何改變全球健康多動症遊戲,健康工具和AI聊天機器人如何改變全球健康Apr 14, 2025 am 11:27 AM

視頻遊戲可以緩解焦慮,建立焦點或支持多動症的孩子嗎? 隨著醫療保健在全球範圍內挑戰,尤其是在青年中的挑戰,創新者正在轉向一種不太可能的工具:視頻遊戲。現在是世界上最大的娛樂印度河之一

沒有關於AI的投入:獲勝者,失敗者和機遇沒有關於AI的投入:獲勝者,失敗者和機遇Apr 14, 2025 am 11:25 AM

“歷史表明,儘管技術進步推動了經濟增長,但它並不能自行確保公平的收入分配或促進包容性人類發展,”烏托德秘書長Rebeca Grynspan在序言中寫道。

通過生成AI學習談判技巧通過生成AI學習談判技巧Apr 14, 2025 am 11:23 AM

易於使用,使用生成的AI作為您的談判導師和陪練夥伴。 讓我們來談談。 對創新AI突破的這種分析是我正在進行的《福布斯》列的最新覆蓋範圍的一部分,包括識別和解釋

泰德(Ted)從Openai,Google,Meta透露出庭,與我自己自拍泰德(Ted)從Openai,Google,Meta透露出庭,與我自己自拍Apr 14, 2025 am 11:22 AM

在溫哥華舉行的TED2025會議昨天在4月11日舉行了第36版。它的特色是來自60多個國家 /地區的80個發言人,包括Sam Altman,Eric Sc​​hmidt和Palmer Luckey。泰德(Ted)的主題“人類重新構想”是量身定制的

約瑟夫·斯蒂格利茲(Joseph Stiglitz約瑟夫·斯蒂格利茲(Joseph StiglitzApr 14, 2025 am 11:21 AM

約瑟夫·斯蒂格利茨(Joseph Stiglitz)是2001年著名的經濟學家,是諾貝爾經濟獎的獲得者。斯蒂格利茨認為,AI可能會使現有的不平等和合併權力惡化,並在一些主導公司手中加劇,最終破壞了經濟上的經濟。

什麼是圖形數據庫?什麼是圖形數據庫?Apr 14, 2025 am 11:19 AM

圖數據庫:通過關係徹底改變數據管理 隨著數據的擴展及其特徵在各個字段中的發展,圖形數據庫正在作為管理互連數據的變革解決方案的出現。與傳統不同

LLM路由:策略,技術和Python實施LLM路由:策略,技術和Python實施Apr 14, 2025 am 11:14 AM

大型語言模型(LLM)路由:通過智​​能任務分配優化性能 LLM的快速發展的景觀呈現出各種各樣的模型,每個模型都具有獨特的優勢和劣勢。 有些在創意內容gen上表現出色

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
4 週前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
1 個月前By尊渡假赌尊渡假赌尊渡假赌

熱工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

Safe Exam Browser

Safe Exam Browser

Safe Exam Browser是一個安全的瀏覽器環境,安全地進行線上考試。該軟體將任何電腦變成一個安全的工作站。它控制對任何實用工具的訪問,並防止學生使用未經授權的資源。

MantisBT

MantisBT

Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

SecLists

SecLists

SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

強大的PHP整合開發環境