本文經AI新媒體量子位元(公眾號ID:QbitAI)授權轉載,轉載請聯絡來源。
Google整出了一個新「AI導演」,一句話甚至能把影片主角換了。
你看,青青草地上,一隻小熊正在跳舞。
難道現在的熊都這麼有藝術細胞了? ?
No,No,No!草地上原有的其實是隻猴子。
要從猴子變熊,只用跟這個AI說一句:
一隻小熊隨著音樂節拍跳著舞,扭動他的整個身體。 (A bear dancing and jumping to upbeat music, moving his whole body)
除了會「魔改」視頻,這個名為Dreamix的AI還能把靜態圖片變成動畫-也是一句話就搞定。
例如給此AI看一張“海龜游泳照”,再告訴它:
水下拍到一隻海龜在游泳,後面有隻鯊魚正在靠近。 (Underwater shot of a sea turle with a shark apporching from behind)
##好傢伙,一句話不只讓海龜遊起來了,還憑空加了條鯊魚。 這效果,讓不少圍觀網友都紛紛按讚。 有人甚至斷言,AIGC將在接下的兩年時間繼續掀起熱潮,甚至比千禧年間的發展更加瘋狂。 導演視頻,只用一句話一經公開就能受到盛贊,這個AI究竟如何?不妨再看看其更多的「導演」作品來感受一下。 首先,在更換影片角色方面,這是原本的田野:
這是AI放火燒掉的田野: 這是人的手在寫字: ##這是AI生成的機器人手在寫字:同樣以人寫字的視頻為原型,如果把提示句子換成“人的手在畫圓”,還會有不同的生成效果:
而在靜態圖變動畫方面,原圖是霧濛濛的叢林:
而AI為這片林子加了一隻奔跑的獨角獸,而且鏡頭還按句子提示給拉遠了。 還有這樣一張河谷風景圖: AI不僅讓溪水流動起來,還給岸邊加上了來洗澡水牛,給天空加上了飛翔的小鳥。看到這裡,有人可能會覺得欠點火候:動畫倒是做出來了,但畫質也犧牲了挺多啊。
那不妨多給AI看幾張圖。
例如一口氣給AI看7張玩具火警的照片:
#然後再讓它根據一句話生成視頻,這下畫質就會清楚很多。
至於這個」AI導演」是怎麼做的,Google表示,關鍵在於「老朋友」擴散模式 (Diffusion Model) 。
擴散模型,也是火出圈的AIGC作畫神器DALL·E 2的核心。
Google研究人員指出,其實之前已有類似的「文字生成影片」AI了,但若僅僅在輸入影片上對影片擴散模型進行微調,會限制運動變化的程度。
而此AI與眾不同之處在於:
團隊使用了一個「混合目標」,除了對原始目標進行微調外,還會對無序幀集進行微調。
他們採用了一種深度學習中專門的注意力機制:Masked Temporal Attention,幫助模型專注於輸入資訊的特定部分,忽略其他無關的部分。
——這提高了模型處理序列資料的能力,產生影片中的動態更多樣化,效果也比較自然。
在擴散模型和Masked Temporal Attention的加持下,對於更換影片主角來說,輸入其實已經被省略了-只需進行微調,結果的保真度也相當不錯。
以上是谷歌新的「AI導演」神奇之處在於只需一句話即可改變影片主角,這令人驚嘆,同時畫質也非常優秀。的詳細內容。更多資訊請關注PHP中文網其他相關文章!