機器之能報道
編輯:楊文
誰能成為AI視訊圈的King? 美劇《權力的遊戲》中,有一把「鐵王座」。 傳說,它由巨龍「黑死神」熔掉上千把敵人丟棄的利劍鑄成,象徵無上的權威。為了坐上這張鐵椅,各大家族展開了一場場爭鬥和廝殺。 而自Sora 出現以來,AI 視訊圈也掀起了一場轟轟烈烈的「權力的遊戲」,這場遊戲的玩家主要有大洋彼岸的Runway Gen-3、Luma,國內的快手可靈、字節即夢、智譜清影、Vidu、PixVerse V2 等。
今天我們就來評測一下,看看究竟誰有資格登上 AI 視訊圈的「鐵王座」。
-1-
文生影片
目前,文生視訊功能已經是各家AI 視訊產品的「拿手好戲」,我們就把它當個開胃菜。
Prompt 1:The camera directly faces colorful buildings in Burano Italy. An adorable dalmation looks through a window on a building on the ground floor.鏡頭直接對著義大利布拉諾五顏六色的建築,一隻可愛的斑點狗從一樓的窗戶往外看。
可靈:
即夢:
清影:
清影:
PixVerse V2:
Luma:

Prompt 2:Nighttime footage of hermit crabs using light bulbs as shells.
寄居蟹用燈泡做殼的殼夜間鏡頭。 可靈:
即夢:
PixVerse V2:
Luma:
Luma 的寄居蟹長得最奇怪,圓滾滾的,有點像滿地爬的蟑螂。
Prompt 3:The story of a robot's life in a cyberpunk setting.
中文提示詞3:
一個機器人在賽博朋克背景下的生活故事。可靈:
即夢:
清影:
Vidu:
PixVerse V2:

Runway Gen-3:
除了Luma 沒有出現像樣的機器人外,其他各家都展示了各自想像中的機器人形象。
可靈生成的視頻畫面,在構圖和鏡頭上神似Sora 放出來的“東京女子走在街頭”的示例;即夢的畫面最為精美和賽博朋克,而Vidu 則有種科幻片的即視感; PixVerse V2 的機器人最怪異,像頂了個水桶頭。
要說逼真程度以及運動幅度,Runway Gen-3 的效果似乎更勝一籌,當然它也有 bug,例如憑空出現並向後疾馳的汽車。
Prompt 4:The waves are lapping against the shells on the beach.
提示詞 4: 海浪拍打沙灘上的貝殼。
可靈:
即夢:
清影:
Vidu:
PixVerse V2:
Runway Gen-3:
整體來說,可靈和即夢生成的效果最真實,Luma 的貝殼看起來有點變形,最離譜的是PixVerse V2,一開始畫面還算正常,但眨眼功夫跑出來一個人,面部表情以及手部崩得沒眼看。
Prompt 5:
Cartoon style, a kangaroo is dancing提示詞 5: 卡通風格,一隻袋鼠在跳舞。
可靈:
即夢:
清影:
Vidu:
PixVerse V2:

Runway Gen-3:
AI 理解的動畫風格的袋鼠可像五花八門,有像老鼠的,也有像不明物種的。相較而言,可靈、Vidu 和 Runway Gen-3 效果較佳,起碼沒有大面積的模糊虛化。
-2-
圖生影片
這幾家號稱對標Sora 的影片產生模型也都上線了「圖生影片」功能,只要上傳一張圖片,輸入提示詞就可以讓靜態圖片動起來。
Round 1
上傳一張皮卡丘的圖片,輸入提示詞:皮卡丘開心地蹦起來(It jumps up happily)。
可靈:
即夢:
清影:
Vidu:
PixVerse V2:
PixVerse V2:
Luma:
Runway Gen-3:
這輪現在Vidu 大勝,不只運動幅度大勝,表情、動作流暢,而且蹦跳的過程畫面沒垮;只是沒想到,這輪效果最差的是Runway Gen-3,各種稀奇古怪的變形。
Round 2上傳一張格蘭特・伍德著名的油畫《美國哥德式》,輸入提示字:兩個人笑了起來(They laugh)。
可靈:
即夢:
清影:
Vidu:
PixVerse V2:
PixVerse V2:
>Luma:Runway Gen-3:
從表情的自然程度來說,這把我選Runway Gen-3、可靈和Vidu,你覺得呢?
-3-
小編有話
Runway 不愧是AI 視訊圈的「扛把子」,Gen-3 著實能打,除了皮卡丘翻車以外,其他測試均表現不錯。 其次就是可靈,生成畫面比較穩定,對於提示詞的遵循也挺到位。 即夢對於顏色的駕馭最強,它產生的視訊顏色搭配最舒服,不足之處就是當動作幅度過大時,畫面容易模糊變形。 Vidu 的動畫效果最好,很擅長把動漫角色動態化這類活兒,而且生成速度快,生成一段 4 秒的影片只需 30 秒以上。 Luma,這個曾經讓全球網友瘋狂的整活工具,在此次實測中,相比於可靈和Runway Gen-3,它的表現並不突出,而且生成速度極慢,有時候一段5 秒的影片得花半個多小時,甚至更長。 從付費情況來看,目前除了 Runway Gen-3 需要完全付費外,其他各家都有免費體驗次數。其中智譜清影處於內測階段,可免費無限次生成。工具連結:
快手可靈:https://klingai.kuaishou.com/
位元組即夢:https://jimeng.jianying.com/ai-tool/home?activeTab=video&subTab=video
生數Vidu:https: //www.vidu.studio/
智譜清影:https://chatglm.cn/video
PixVerse:https: //pixverse.ai/
Luma:https://lumalabs.ai/dream-machine
Runway Gen-3:https: //runwayml.com/
以後我們會帶來更多AI大模型、AI應用的一手評測,也歡迎大家進群交流。
以上是實測7款「Sora級」影片生成神器,誰有本事登上「鐵王座」?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

Meta的Llama 3.1 70b和Llama 3 70b:詳細的比較 Meta最近發布了Llama 3.1,包括70B參數模型,以及較大和較小的變體。 此次升級是在三個月前的Llama 3發布之後發布的。而駱駝3.1

釋放您的演示文稿能力:7個免費的AI驅動PowerPoint Maker 無論您是製作傑出的頂峰項目的最後一年學生還是忙碌的專業雜耍會議和演講,給人留下深刻的印像都是至關重要的。

介紹 想像一個場景:您的團隊被來自不同來源的大量數據集所淹沒。 整合,分類和分析此信息以進行有意義的演示是一個挑戰。這是Power BI語義模型(PBISM)EX

AI特工:由Llamaindex和Monsterapi提供支持的AI的未來 AI代理有望徹底改變我們與技術的互動方式。 這些自主系統模仿人類行為,執行需要推理,決策和REA的任務

解鎖自治AI:自我訓練LLMS的7種方法 想像一個未來AI系統在沒有人類干預的情況下學習和發展的未來,就像孩子獨立掌握複雜概念的孩子一樣。這不是科幻小說;這是自我的應許

AI驅動的財務報告:通過自然語言產生革新見解 在當今動態的業務環境中,準確及時的財務分析對於戰略決策至關重要。 傳統財務報告

Google DeepMind的乒乓球機器人:體育和機器人技術的新時代 巴黎2024年奧運會可能已經結束,但是由於Google DeepMind,運動和機器人技術的新時代正在興起。 他們的開創性研究(“實現人類水平的競爭

雙子座閃光燈1.5解鎖效率和可伸縮性:燒瓶食物視覺webapp 在快速發展的AI景觀中,效率和可擴展性至關重要。 開發人員越來越多地尋求高性能模型,以最大程度地減少成本和延遲


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

VSCode Windows 64位元 下載
微軟推出的免費、功能強大的一款IDE編輯器

EditPlus 中文破解版
體積小,語法高亮,不支援程式碼提示功能

SublimeText3 Linux新版
SublimeText3 Linux最新版

Dreamweaver CS6
視覺化網頁開發工具

DVWA
Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中