搜尋
首頁科技週邊人工智慧Stable Diffusion XL Turbo可以「即時」的速度產生AI影像

即使在家裡,Stable Diffusion XL Turbo(SDXL Turbo)也可以以驚人的速度創建詳細的圖像。

週二,Stability AI公司發布了一款名為「穩定擴散XL Turbo」的人工智慧影像合成模型。該模型能夠根據書面提示迅速生成圖像。實際上,該模型的速度非常快,以至於該公司將其宣傳為“實時”圖像生成器,因為它還能夠迅速轉換來自網絡攝像頭等來源的圖像

Stable Diffusion XL Turbo可以以“实时”的速度生成AI图像

SDXL Turbo的主要創新在於它能夠在一個步驟中產生影像輸出,比其前身所需的20-50個步驟顯著減少。 Stability AI將這種效率的飛躍歸功於一種被稱為對抗性擴散蒸餾(ADD)的技術。 ADD使用分數提取,其中模型從現有的圖像合成模型中學習,以及對抗性損失,這增強了模型區分真實圖像和生成圖像的能力,提高了輸出的真實性。

在周二發表的一篇專注於ADD技術的研究論文中,Stability AI詳細介紹了該模型的內部工作原理。 SDXL Turbo的優點之一是它與生成對抗網路(GAN)相似,特別是在產生單步影像輸出方面。

SDXL Turbo的圖像並不像SDXL在更高解析度下產生的圖像那樣詳細,因此它並不能完全取代先前的型號。然而,它以其驚人的速度節省了時間

為了進行嘗試,我們使用Automatic111 在Nvidia RTX 3060上本地運行SDXL Turbo(權重與SDXL權重一樣下降),它可以在大約4秒內生成3步1024×1024圖像,而具有類似細節的20步SDXL影像則需要26.4秒。較小的影像產生速度要快得多(對於512×768而言,不到1秒),當然,更強大的顯示卡,如RTX 3090或4090,也將允許更快的生成時間。與Stability的營銷相反,我們發現SDXL Turbo圖像在每張圖像大約3-5步處具有最佳細節。

SDXL Turbo的生成速度就是所謂的「即時」。 Stability AI表示,在NVIDIA A100(一款強大的AI調整圖形處理器)上,該模型可以在207ms內產生一張512×512影像,包括編碼、單一去噪步驟和解碼。如果能夠解決一致性問題,這樣的速度可能會導致即時生成AI視訊濾鏡或實驗性視訊遊戲影像生成。在這種情況下,一致性意味著在多個幀或代之間保持相同的主題。

Stable Diffusion XL Turbo可以以“实时”的速度生成AI图像

目前,SDXL Turbo是在非商業研究許可證下提供的,限制其用於個人非商業目的。這項舉措已經在Stable Diffusion社群受到了一些批評,但Stability AI表示對商業應用持開放態度,並邀請感興趣的各方聯繫以獲取更多資訊。

與此同時,Stability AI面臨內部管理問題,一位投資者最近敦促執行長埃馬德·莫斯塔克(Emad Mostaque)辭職。根據報道,Stability AI管理層一直在探索將公司出售給更大實體的可能性,但這並沒有影響Stability AI發布新產品的速度。就在上週,該公司推出了一款名為「穩定視訊擴散」(Stable Video Diffusion)的軟體,可以將靜止影像轉換成短影片剪輯

Stability AI在其影像編輯平台Clipdrop上提供了SDXL Turbo功能的測試版演示。你也可以在 Hugging Face 上免費試用一個非官方的現場示範。顯然,所有常見的警告都適用,包括缺乏訓練資料的來源和濫用的可能性。即使有這些懸而未決的問題,人工智慧影像合成的技術進步肯定不會放緩。

如果你的朋友喜歡的話,請注意一下「知新了」!

以上是Stable Diffusion XL Turbo可以「即時」的速度產生AI影像的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:搜狐。如有侵權,請聯絡admin@php.cn刪除
人工智能治療師在這裡:您需要了解的14個開創性的心理健康工具人工智能治療師在這裡:您需要了解的14個開創性的心理健康工具Apr 30, 2025 am 11:17 AM

儘管它無法提供訓練有素的治療師的人類聯繫和直覺,但研究表明,許多人很樂意與相對無面和匿名的AI機器人分享他們的擔憂和擔憂。 這是否總是好我

叫AI到雜貨店過道叫AI到雜貨店過道Apr 30, 2025 am 11:16 AM

人工智能(AI)是一種技術數十年的技術,正在徹底改變食品零售業。 從大規模的效率提高和成本降低到精簡的各種業務功能的流程,AI的影響是Undeniabl

從生成的AI中進行佩普談話來提升您的精神從生成的AI中進行佩普談話來提升您的精神Apr 30, 2025 am 11:15 AM

讓我們來談談。 對創新的AI突破的分析是我正在進行的AI中正在進行的《福布斯》列覆蓋範圍的一部分,包括識別和解釋各種有影響力的AI複雜性(請參閱此處的鏈接)。此外,對於我的comp

為什麼AI驅動的超個性化是所有企業必須的為什麼AI驅動的超個性化是所有企業必須的Apr 30, 2025 am 11:14 AM

保持專業形象需要偶爾的衣櫃更新。 在線購物方便時,它缺乏面對面嘗試的確定性。 我的解決方案? AI驅動的個性化。 我設想AI助手策劃服裝Selecti

忘記Duolingo:Google Translate的新AI功能教授語言忘記Duolingo:Google Translate的新AI功能教授語言Apr 30, 2025 am 11:13 AM

谷歌翻譯新增語言學習功能 據Android Authority報導,應用專家AssembleDebug發現,最新版本的谷歌翻譯應用包含一個新的“練習”模式的測試代碼,旨在幫助用戶通過個性化活動來提高他們的語言技能。此功能目前對用戶不可見,但AssembleDebug能夠部分激活它並查看其一些新的用戶界面元素。 激活後,該功能會在屏幕底部添加一個新的“畢業帽”圖標,標有“Beta”徽章,表明“練習”功能最初將以實驗形式發布。 相關的彈出提示顯示“練習為你量身定制的活動!”,這意味著谷歌將生成定制的

他們正在為AI製作TCP/IP,這就是Nanda他們正在為AI製作TCP/IP,這就是NandaApr 30, 2025 am 11:12 AM

麻省理工學院的研究人員正在開發Nanda,這是為AI代理設計的開創性的Web協議。 Nanda的縮寫是網絡代理和分散的AI,通過添加Internet功能,使AI Agen能夠構建人類的模型上下文協議(MCP)。

提示:DeepFake檢測是一項蓬勃發展的業務提示:DeepFake檢測是一項蓬勃發展的業務Apr 30, 2025 am 11:11 AM

Meta的最新冒險:與Chatgpt競爭的AI應用程序 Facebook,Instagram,WhatsApp和Threads的母公司Meta正在啟動新的AI功能應用程序。 這個獨立的應用程序Meta AI旨在直接與Openai的Chatgpt競爭。 槓桿

接下來的兩年在AI網絡安全方面為業務領導者接下來的兩年在AI網絡安全方面為業務領導者Apr 30, 2025 am 11:10 AM

導航AI網絡攻擊的上升潮流 最近,CISO的傑森·克林頓(Jason Clinton)擬人化,強調了與非人類身份相關的新興風險 - 作為機器對機器的通信增殖,維護這些“身份”

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

MantisBT

MantisBT

Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

mPDF

mPDF

mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

WebStorm Mac版

WebStorm Mac版

好用的JavaScript開發工具

VSCode Windows 64位元 下載

VSCode Windows 64位元 下載

微軟推出的免費、功能強大的一款IDE編輯器