搜尋
首頁科技週邊人工智慧Stable Video Diffusion問世! 3D合成功能引關注,網友:進步太快

穩定擴散官方終於開始處理影片-

發布生成式影片模型Stable Video Diffusion(SVD)

Stable Video Diffusion问世!3D合成功能引关注,网友:进步太快

Stability AI官方部落格顯示,全新SVD支援文字轉影片、圖片到影片產生:

Stable Video Diffusion问世!3D合成功能引关注,网友:进步太快

##並且還支持物體從單一視角到多視角的轉化,也就是

3D合成

Stable Video Diffusion问世!3D合成功能引关注,网友:进步太快

#根據外部評估,官方宣稱SVD甚至比runway和Pika的影片生成AI更受用戶歡迎。

儘管目前只發布了基礎模型,但官方透露「正計劃繼續擴展,建立類似於穩定擴散的生態系統」

目前論文程式碼權重已上線。

Stable Video Diffusion问世!3D合成功能引关注,网友:进步太快

近期視訊生成領域不斷湧現新的玩法,如今輪到了Stable Diffusion的出現,以至於網友們紛紛感嘆“快”,這樣進步的速度太快了!

Stable Video Diffusion问世!3D合成功能引关注,网友:进步太快

但僅從Demo效果來說,更多網友們表示並沒有感到很驚喜。

雖然我喜歡SD,而且這些Demo也很棒……但也存在一些缺陷,光影不對、而且整體不連貫

(視頻幀與幀之間閃爍)

Stable Video Diffusion问世!3D合成功能引关注,网友:进步太快

總歸來說這是個開始,網友對SVD的3D合成功能還滿是看好:

我敢保證,很快就會有更好的東西問世,只需要簡單描述一下,就能夠呈現一個完整的3D場景

Stable Video Diffusion问世!3D合成功能引关注,网友:进步太快

#SD視頻官方版來襲

除了以上所展示的,官方也發布了更多的演示,下面來先看一下:

Stable Video Diffusion问世!3D合成功能引关注,网友:进步太快

#太空漫步也安排上:

Stable Video Diffusion问世!3D合成功能引关注,网友:进步太快

保持背景靜止,只讓兩隻鳥移動也可以:

Stable Video Diffusion问世!3D合成功能引关注,网友:进步太快

SVD的研究論文目前也已發布,據介紹SVD基於Stable Diffusion 2.1,用約6億個樣本的視訊資料集預先訓練了基礎模型。

可輕鬆適應各種下游任務,包括透過對多視圖資料集進行微調從單一影像進行多視圖合成。

經過微調後,官方公佈了兩種圖像到影片模型。這些模型可以根據使用者的需求,以每秒3到30幀的自訂幀速率生成14幀(SVD)和25幀(SVD-XT)的視訊

Stable Video Diffusion问世!3D合成功能引关注,网友:进步太快

對多視角視訊生成模型進行了微調後,我們將其命名為SVD-MV

Stable Video Diffusion问世!3D合成功能引关注,网友:进步太快

根據測試結果,在GSO資料集上,SVD-MV得分優於多視角生成模型Zero123、Zero123XL、SyncDreamer:

Stable Video Diffusion问世!3D合成功能引关注,网友:进步太快

值得一提的是,Stability AI表示SVD目前僅限於研究,不適用於實際或商業應用。 SVD目前也不是所有人都可以使用,但已開放用戶候補名單註冊。

影片生成大爆發

近期,影片產生領域出現了一種「混戰」狀態

前有PikaLabs開發的文生影片AI:

Stable Video Diffusion问世!3D合成功能引关注,网友:进步太快

後又有號稱「史上最強大的影片生成AIMoonvalley推出:

Stable Video Diffusion问世!3D合成功能引关注,网友:进步太快

##最近Gen-2的

「運動筆刷」功能也正式上線,指哪畫哪:

Stable Video Diffusion问世!3D合成功能引关注,网友:进步太快

這不現在SVD又出現了,又有要卷3D影片生成的可能。

但文字到3D生成方面好像還沒有太多進展,網友對這一現像也很是困惑。

Stable Video Diffusion问世!3D合成功能引关注,网友:进步太快

有人認為數據是阻礙發展的瓶頸:

Stable Video Diffusion问世!3D合成功能引关注,网友:进步太快

還有一些網友認為問題在於強化學習的能力還不夠強

Stable Video Diffusion问世!3D合成功能引关注,网友:进步太快

家人們對這方面的最新進展有了解嗎?歡迎評論區分享~

論文連結:https://static1.squarespace.com/static/6213c340453c3f502425776e /t/655ce779b9d47d342a93c890/1700587395994/stable_video_diffusion.pdf 需要重新寫的內容是:

以上是Stable Video Diffusion問世! 3D合成功能引關注,網友:進步太快的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
外推指南外推指南Apr 15, 2025 am 11:38 AM

介紹 假設有一個農民每天在幾週內觀察農作物的進展。他研究了增長率,並開始思考他的植物在幾週內可以生長的高度。從Th

軟AI的興起及其對當今企業的意義軟AI的興起及其對當今企業的意義Apr 15, 2025 am 11:36 AM

軟AI(被定義為AI系統,旨在使用近似推理,模式識別和靈活的決策執行特定的狹窄任務 - 試圖通過擁抱歧義來模仿類似人類的思維。 但是這對業務意味著什麼

為AI前沿的不斷發展的安全框架為AI前沿的不斷發展的安全框架Apr 15, 2025 am 11:34 AM

答案很明確 - 只是雲計算需要向雲本地安全工具轉變,AI需要專門為AI獨特需求而設計的新型安全解決方案。 雲計算和安全課程的興起 在

生成AI的3種方法放大了企業家:當心平均值!生成AI的3種方法放大了企業家:當心平均值!Apr 15, 2025 am 11:33 AM

企業家,並使用AI和Generative AI來改善其業務。同時,重要的是要記住生成的AI,就像所有技術一樣,都是一個放大器 - 使得偉大和平庸,更糟。嚴格的2024研究O

Andrew Ng的新簡短課程Andrew Ng的新簡短課程Apr 15, 2025 am 11:32 AM

解鎖嵌入模型的力量:深入研究安德魯·NG的新課程 想像一個未來,機器可以完全準確地理解和回答您的問題。 這不是科幻小說;多虧了AI的進步,它已成為R

大語言模型(LLM)中的幻覺是不可避免的嗎?大語言模型(LLM)中的幻覺是不可避免的嗎?Apr 15, 2025 am 11:31 AM

大型語言模型(LLM)和不可避免的幻覺問題 您可能使用了諸如Chatgpt,Claude和Gemini之類的AI模型。 這些都是大型語言模型(LLM)的示例,在大規模文本數據集上訓練的功能強大的AI系統

60%的問題 -  AI搜索如何消耗您的流量60%的問題 - AI搜索如何消耗您的流量Apr 15, 2025 am 11:28 AM

最近的研究表明,根據行業和搜索類型,AI概述可能導致有機交通下降15-64%。這種根本性的變化導致營銷人員重新考慮其在數字可見性方面的整個策略。 新的

麻省理工學院媒體實驗室將人類蓬勃發展成為AI R&D的核心麻省理工學院媒體實驗室將人類蓬勃發展成為AI R&D的核心Apr 15, 2025 am 11:26 AM

埃隆大學(Elon University)想像的數字未來中心的最新報告對近300名全球技術專家進行了調查。由此產生的報告“ 2035年成為人類”,得出的結論是,大多數人擔心AI系統加深的採用

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
4 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
4 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
4 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.聊天命令以及如何使用它們
4 週前By尊渡假赌尊渡假赌尊渡假赌

熱工具

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

MantisBT

MantisBT

Mantis是一個易於部署的基於Web的缺陷追蹤工具,用於幫助產品缺陷追蹤。它需要PHP、MySQL和一個Web伺服器。請查看我們的演示和託管服務。

SublimeText3 英文版

SublimeText3 英文版

推薦:為Win版本,支援程式碼提示!

mPDF

mPDF

mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),