




接下來,我們不妨一邊試用、一邊分析可靈爆火的原因。




另外一個將被顛覆的產業就是影視製作。傳統的電影製作是一個艱鉅而昂貴的過程,往往需要數年的努力、大量的設備和資金投入。視訊生成技術的出現預示著電影製作進入了一個新的「民主化時代」,從簡單的文字輸入中自主生成個人影視作品的夢想正在成為現實。
現在,我們用可靈生成的是 5 秒的單鏡頭片段,伴隨著技術的不斷演進,用戶單次能夠生成的視頻時長也會增加。比如說,我們未來或許能夠一次生成更長的影片內容,保持故事場景的連貫性和觀賞性。其中的運鏡手法也許會更高級,例如連貫的長鏡頭。
下面這段剪影作品再次印證了一點:AI 對藝術的理解力與美學水準,絲毫不遜於人類。



依托快手在視頻技術領域的多年積累,可靈大模型團隊已經構建了完備的標籤體系,包括從視頻基礎質量、美學、自然度等多個美學、自然度維度將影片資料品質刻畫,並針對每個維度設計多種客製化的標籤特徵,以此來精細化篩選訓練資料或調整訓練資料的分佈。
為了滿足訓練文生視頻模型過程中成對的視頻和文本描述需求,可靈大模型團隊自研了視頻描述模型,可以產生精確、詳盡、結構化的視頻描述,顯著提升視頻生成模型的文字指令響應能力。
高品質的標註資料準備完畢後,可靈大模型又是如何獲得模擬物理世界特性與概念組合的能力呢?
在整體架構設計上,可靈採用了目前火熱的 Diffusion Transformer (DiT) 。傳統的擴散模型主要利用包含下採樣和上採樣塊的捲積 U-Net 作為去噪網絡骨幹。但一些研究表明,U-Net 架構對擴散模型的良好性能並非至關重要。透過採用更靈活的 Transformer 架構,擴散模型可以使用更多的訓練資料和更大的模型參數。 DiT 就是這個研究思路下的代表作之一。
Sora 等級的可用產品,而Sora 何時開放也是未知數。
某種意義上說,可靈是第一個真正的「中國版 Sora」,並讓這項技術真正進入了可用、好用、實用的階段。
正如傅盛所說:「這可能是今天在全世界範圍內,你能夠使用到的最好的文生視頻產品。」任何親自試用過可靈的人,都會明白這絕不是過譽。
傅盛的影片也給了另一個觀點:「反過來也說明,Sora 並不是技術性的突破,而是產品型的突破。」
還記得幾個月前,Sora 以長達60 秒的連貫視頻、高清畫面質感、連貫的鏡頭移動、運動方式等優點,拉高了整個視頻生成賽道的技術水平,掀起了文生視頻賽道的競爭浪潮。
我們以為,影片產生領域會像去年的文字大模型一樣,演化為國內對海外的技術追趕。但可靈的發布,意味著國產文生視頻大模型技術的探索已經達到了一個全新的高度,而且在產品落地層面做到了實質領先。我們可能不需要再重新經歷一次「追趕 OpenAI」的遊戲了。

可靈的誕生,或許意味著一個新時代開啟了。在生成式 AI 時代,生成和編輯影片或許會像今天我們用手機 P 圖一樣簡單,想像力與現實之間的阻隔將被徹底打破。

以上是快手「可靈」爆火:海外AI圈巨震,中國版Sora一號難求的詳細內容。更多資訊請關注PHP中文網其他相關文章!

介紹 恭喜!您經營一家成功的業務。通過您的網頁,社交媒體活動,網絡研討會,會議,免費資源和其他來源,您每天收集5000個電子郵件ID。下一個明顯的步驟是

介紹 在當今快節奏的軟件開發環境中,確保最佳應用程序性能至關重要。監視實時指標,例如響應時間,錯誤率和資源利用率可以幫助MAIN

“您有幾個用戶?”他扮演。 阿爾特曼回答說:“我認為我們上次說的是每週5億個活躍者,而且它正在迅速增長。” “你告訴我,就像在短短幾週內翻了一番,”安德森繼續說道。 “我說那個私人

介紹 Mistral發布了其第一個多模式模型,即Pixtral-12b-2409。該模型建立在Mistral的120億參數Nemo 12B之上。是什麼設置了該模型?現在可以拍攝圖像和Tex

想像一下,擁有一個由AI驅動的助手,不僅可以響應您的查詢,還可以自主收集信息,執行任務甚至處理多種類型的數據(TEXT,圖像和代碼)。聽起來有未來派?在這個a


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

Atom編輯器mac版下載
最受歡迎的的開源編輯器

SAP NetWeaver Server Adapter for Eclipse
將Eclipse與SAP NetWeaver應用伺服器整合。

PhpStorm Mac 版本
最新(2018.2.1 )專業的PHP整合開發工具

Dreamweaver CS6
視覺化網頁開發工具

mPDF
mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),