即使在家裡,Stable Diffusion XL Turbo(SDXL Turbo)也可以以驚人的速度創建詳細的圖像。
週二,Stability AI公司發布了一款名為「穩定擴散XL Turbo」的人工智慧影像合成模型。該模型能夠根據書面提示迅速生成圖像。實際上,該模型的速度非常快,以至於該公司將其宣傳為“實時”圖像生成器,因為它還能夠迅速轉換來自網絡攝像頭等來源的圖像
SDXL Turbo的主要創新在於它能夠在一個步驟中產生影像輸出,比其前身所需的20-50個步驟顯著減少。 Stability AI將這種效率的飛躍歸功於一種被稱為對抗性擴散蒸餾(ADD)的技術。 ADD使用分數提取,其中模型從現有的圖像合成模型中學習,以及對抗性損失,這增強了模型區分真實圖像和生成圖像的能力,提高了輸出的真實性。
在周二發表的一篇專注於ADD技術的研究論文中,Stability AI詳細介紹了該模型的內部工作原理。 SDXL Turbo的優點之一是它與生成對抗網路(GAN)相似,特別是在產生單步影像輸出方面。
SDXL Turbo的圖像並不像SDXL在更高解析度下產生的圖像那樣詳細,因此它並不能完全取代先前的型號。然而,它以其驚人的速度節省了時間
為了進行嘗試,我們使用Automatic111 在Nvidia RTX 3060上本地運行SDXL Turbo(權重與SDXL權重一樣下降),它可以在大約4秒內生成3步1024×1024圖像,而具有類似細節的20步SDXL影像則需要26.4秒。較小的影像產生速度要快得多(對於512×768而言,不到1秒),當然,更強大的顯示卡,如RTX 3090或4090,也將允許更快的生成時間。與Stability的營銷相反,我們發現SDXL Turbo圖像在每張圖像大約3-5步處具有最佳細節。
SDXL Turbo的生成速度就是所謂的「即時」。 Stability AI表示,在NVIDIA A100(一款強大的AI調整圖形處理器)上,該模型可以在207ms內產生一張512×512影像,包括編碼、單一去噪步驟和解碼。如果能夠解決一致性問題,這樣的速度可能會導致即時生成AI視訊濾鏡或實驗性視訊遊戲影像生成。在這種情況下,一致性意味著在多個幀或代之間保持相同的主題。
目前,SDXL Turbo是在非商業研究許可證下提供的,限制其用於個人非商業目的。這項舉措已經在Stable Diffusion社群受到了一些批評,但Stability AI表示對商業應用持開放態度,並邀請感興趣的各方聯繫以獲取更多資訊。
與此同時,Stability AI面臨內部管理問題,一位投資者最近敦促執行長埃馬德·莫斯塔克(Emad Mostaque)辭職。根據報道,Stability AI管理層一直在探索將公司出售給更大實體的可能性,但這並沒有影響Stability AI發布新產品的速度。就在上週,該公司推出了一款名為「穩定視訊擴散」(Stable Video Diffusion)的軟體,可以將靜止影像轉換成短影片剪輯
Stability AI在其影像編輯平台Clipdrop上提供了SDXL Turbo功能的測試版演示。你也可以在 Hugging Face 上免費試用一個非官方的現場示範。顯然,所有常見的警告都適用,包括缺乏訓練資料的來源和濫用的可能性。即使有這些懸而未決的問題,人工智慧影像合成的技術進步肯定不會放緩。
如果你的朋友喜歡的話,請注意一下「知新了」!
以上是Stable Diffusion XL Turbo可以「即時」的速度產生AI影像的詳細內容。更多資訊請關注PHP中文網其他相關文章!

儘管它無法提供訓練有素的治療師的人類聯繫和直覺,但研究表明,許多人很樂意與相對無面和匿名的AI機器人分享他們的擔憂和擔憂。 這是否總是好我

人工智能(AI)是一種技術數十年的技術,正在徹底改變食品零售業。 從大規模的效率提高和成本降低到精簡的各種業務功能的流程,AI的影響是Undeniabl

讓我們來談談。 對創新的AI突破的分析是我正在進行的AI中正在進行的《福布斯》列覆蓋範圍的一部分,包括識別和解釋各種有影響力的AI複雜性(請參閱此處的鏈接)。此外,對於我的comp

保持專業形象需要偶爾的衣櫃更新。 在線購物方便時,它缺乏面對面嘗試的確定性。 我的解決方案? AI驅動的個性化。 我設想AI助手策劃服裝Selecti

谷歌翻譯新增語言學習功能 據Android Authority報導,應用專家AssembleDebug發現,最新版本的谷歌翻譯應用包含一個新的“練習”模式的測試代碼,旨在幫助用戶通過個性化活動來提高他們的語言技能。此功能目前對用戶不可見,但AssembleDebug能夠部分激活它並查看其一些新的用戶界面元素。 激活後,該功能會在屏幕底部添加一個新的“畢業帽”圖標,標有“Beta”徽章,表明“練習”功能最初將以實驗形式發布。 相關的彈出提示顯示“練習為你量身定制的活動!”,這意味著谷歌將生成定制的

麻省理工學院的研究人員正在開發Nanda,這是為AI代理設計的開創性的Web協議。 Nanda的縮寫是網絡代理和分散的AI,通過添加Internet功能,使AI Agen能夠構建人類的模型上下文協議(MCP)。

Meta的最新冒險:與Chatgpt競爭的AI應用程序 Facebook,Instagram,WhatsApp和Threads的母公司Meta正在啟動新的AI功能應用程序。 這個獨立的應用程序Meta AI旨在直接與Openai的Chatgpt競爭。 槓桿

導航AI網絡攻擊的上升潮流 最近,CISO的傑森·克林頓(Jason Clinton)擬人化,強調了與非人類身份相關的新興風險 - 作為機器對機器的通信增殖,維護這些“身份”


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

禪工作室 13.0.1
強大的PHP整合開發環境

MantisBT
Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

mPDF
mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

WebStorm Mac版
好用的JavaScript開發工具

VSCode Windows 64位元 下載
微軟推出的免費、功能強大的一款IDE編輯器