Stable Diffusion要王者回來了?
Stability AI CEO Emad Mostaque最新推文,四段影片引人無數遐想。
不少網友懷疑,這是Stable Video Diffusion新版的示範Demo。
因為從效果來看,不管是畫面清晰度、一致性還是流暢度都十分驚人。
例如這隻毛絨熊帶著泳鏡潛水。
毛絨熊動作十分流暢,甚至還眨眼睛。而背後也有豐富的海水細節。
再加上Emad Mostaque本人,自今年1月1日開始就消失了幾個星期,始終未曾在社群網路上露面。
網友覺得,這一波更像是憋了個大新聞。 Stability AI is back?
(一度以為Stability AI已經在競爭中落後)
從釋出的四秒Demo來看,應該是針對SVD視訊生成功能的升級。
不過基於文字還是圖像生成尚不能斷定,直接來感受一下效果。
還有這種動畫風夜晚的街道。
去年11月,Stable Video Diffusion(SVD)正式問世,當時除了支援影像、文字到影片之外,還支援物件3D合成。
依照當時透露的計劃, SVD只是作為基礎模型,接下來也將繼續拓展,建立起整個Stable Diffusion的生態系統。
當時網友對Demo的回饋包含光影不對、而且整體不連貫(視訊影格與影格之間閃爍)。
而從現在Demo看,以一個類似影片作對比:綠色機器人躺在床上。
可以看到,機器人,以及旁邊的杯子燈盞,甚至床被枕頭的褶皺細節都更為豐富了。
而且在機器人臉上也有明顯的光影映射。
不過更多更新資訊還得等官方版本發布才能知道。
值得一提的是,在這則推文之後,Emad Mostaque還發了條類似的。
沒有文字,四張靜圖。
網友們表示了期待。 「希望這個模型能全方位地超越SDXL,並且更好地及時迭代。」「這是SD3?」
不過這個地球西紅柿是什麼鬼? ? ?
又是同一天,他們的StableLM2 1.6B發布,只有16億參數的小語言模型。它經過了英語、西班牙語、德語、法語、葡萄牙語和荷蘭語等多語種訓練。
幾天前,他們剛發布新年以來第一個大語言模型Stable Code 3B。
如此頻繁的進展,Stability AI莫不是真的要翻身了?
之所以要說翻身,因為Stability AI在上一波文生圖賽道裡的確備受矚目,Stable Diffusion的爆火,讓它一度成為全球最受關注的AI獨角獸。
但隨著Midjourney的出現,以及OpenAI谷歌在內的頻繁進展,而內部也不安生,包括CEO疑似剽竊成果、挪用公款,公司商業模式不明晰、拖欠工資等情況爆雷,Stability AI一度陷入風波。
去年11月官員進軍影片生成賽道,彼時已經有runway和pika這樣的熱門玩家出現了。
如今SVD新版本疑似亮相,之所以受到眾人關注,除了本身企業之外, 還同當下正在高能爆發的視頻生成賽道密切相關。
不少網友直言:真是一波又一波的捲,一家比一家更卷。
要不是比版本發布迭代,這段時間國內大廠阿里字節等新進展頻出。要嘛是從生成效果,清晰度、流暢性,前段時間,Moonvalley橫空出世,驚呆不少人。
又或在可控性等上面去卷…
這不就在前幾天,runway的Gen-2再進化—
只要5個筆刷,對著一張圖一頓刷刷刷刷刷,原本靜止的小鳥們就各自運動了起來。
那麼在影片產生這個賽道,你看好Stability AI嗎?
以上是AI穩定性再次突飛猛進:驚人的影片生成新演示,網友一致認可的詳細內容。更多資訊請關注PHP中文網其他相關文章!