搜尋
首頁科技週邊人工智慧抖音跳舞不用真人出鏡,一張照片就能產生高品質影片!位元組新科技連抱抱臉CTO都下場體驗了

看!現在正有四位小姐姐在你面前大秀熱舞:

抖音跳舞不用真人出鏡,一張照片就能產生高品質影片!位元組新科技連抱抱臉CTO都下場體驗了

以為是某些主播在短片平台上發布的作品?

No,No,No。

真實答案是:假的,生成的,而且還是只靠了一張圖的那種!

抖音跳舞不用真人出鏡,一張照片就能產生高品質影片!位元組新科技連抱抱臉CTO都下場體驗了

真正的開啟方式是這樣的:

抖音跳舞不用真人出鏡,一張照片就能產生高品質影片!位元組新科技連抱抱臉CTO都下場體驗了

這就是來自新加坡國立大學和位元組跳動最新的一項研究,名叫MagicAnimate

它的功能簡單來說可以總結為一個公式:一張圖片  一組動作 = 毫無違和感的影片

抖音跳舞不用真人出鏡,一張照片就能產生高品質影片!位元組新科技連抱抱臉CTO都下場體驗了

隨著這項技術的公佈,科技圈內掀起了一股軒然大波,眾多科技巨擘和極客們紛紛加入其中

就連HuggingFace CTO都拿自己的頭像體驗了一把:

抖音跳舞不用真人出鏡,一張照片就能產生高品質影片!位元組新科技連抱抱臉CTO都下場體驗了

順便還以一種幽默的方式開了個玩笑:

這算是健身了吧?我這週可以不去健身房了。

還有相當與時俱進的網友,拿著剛出爐的GTA6(俠盜獵車手6)預告片中的人物玩了一把:

抖音跳舞不用真人出鏡,一張照片就能產生高品質影片!位元組新科技連抱抱臉CTO都下場體驗了

甚至連表情包都成為了網友們選擇的物件......

抖音跳舞不用真人出鏡,一張照片就能產生高品質影片!位元組新科技連抱抱臉CTO都下場體驗了

# #MagicAnimate可以說是把科技圈的目光聚焦到了自己身上,因此也有網友調侃說:

OpenAI可以休息一下了。

抖音跳舞不用真人出鏡,一張照片就能產生高品質影片!位元組新科技連抱抱臉CTO都下場體驗了

火,著實火。

一張圖即可產生一段舞

MagicAnimate如此受歡迎,該如何使用呢?

話不多說,我們現在就來手把手地體驗一次。

目前,我們的專案團隊已經在HuggingFace上開放了一個線上體驗頁面

抖音跳舞不用真人出鏡,一張照片就能產生高品質影片!位元組新科技連抱抱臉CTO都下場體驗了

操作非常簡單,只需要三個步驟:

  1. 上傳一張靜態人物照片
  2. 上傳想要產生的動作demo影片
  3. 調整參數,點選「Animate」即可

#舉個例子,以下是我的照片和最近全球風靡的《科目三》舞蹈片段:

抖音跳舞不用真人出鏡,一張照片就能產生高品質影片!位元組新科技連抱抱臉CTO都下場體驗了

#△影片來源:抖音(ID:QC0217)

也可以選擇頁面下方提供的模版進行體驗:

抖音跳舞不用真人出鏡,一張照片就能產生高品質影片!位元組新科技連抱抱臉CTO都下場體驗了

不過需要注意的是,由於MagicAnimate目前過於火爆,在生成的過程中可能會出現“宕機”的情況:

抖音跳舞不用真人出鏡,一張照片就能產生高品質影片!位元組新科技連抱抱臉CTO都下場體驗了

即便成功“食用”,可能也得排大隊抖音跳舞不用真人出鏡,一張照片就能產生高品質影片!位元組新科技連抱抱臉CTO都下場體驗了……

抖音跳舞不用真人出鏡,一張照片就能產生高品質影片!位元組新科技連抱抱臉CTO都下場體驗了

##(沒錯!截至發稿,還是沒有等到結果!)

除此之外,MagicAnimate在GitHub中也給出了本地體驗的方式,感興趣的小伙伴可以試試看喔~

抖音跳舞不用真人出鏡,一張照片就能產生高品質影片!位元組新科技連抱抱臉CTO都下場體驗了

那麼接下來的一個問題就是:

怎麼做到的?

整體而言,MagicAnimate採用的是基於

擴散模型(diffusion)的一個框架,目的就是增強時間一致性、保持參考影像的真實性,並提高動畫保真度。

抖音跳舞不用真人出鏡,一張照片就能產生高品質影片!位元組新科技連抱抱臉CTO都下場體驗了

為此,團隊首先開發了一個

視訊擴散模型(Temporal Consistency Modeling)來編碼時間資訊。

這個模型透過在擴散網路中加入時間注意力模組,來編碼時間訊息,從而確保動畫中各幀之間的時間一致性。

其次,為了保持幀間的外觀一致性,團隊引入了一種新的

外觀編碼器(Appearance Encoder)來保留參考圖像的複雜細節。

這個編碼器與以往使用CLIP編碼的方法有所不同,它能夠提取更密集的視覺特徵,以引導動畫製作,從而更好地保留身份、背景和服裝等資訊

在這兩項創新技術的基礎之上,團隊進一步採用了一種簡單的視頻融合技術

(Video Fusion Technique)來促進長視頻動畫的平滑過渡。

最終,經過兩個基準實驗的驗證,結果顯示MagicAnimate的效果遠遠超過以往的方法

尤其是在具有挑戰性的TikTok舞蹈數據集上,MagicAnimate在視頻保真度方面比最強基線高出38%以上!

以下是團隊給出的定性比較:

抖音跳舞不用真人出鏡,一張照片就能產生高品質影片!位元組新科技連抱抱臉CTO都下場體驗了

並且與cross-ID的最先進的基準模型相比,我們的結果如下:

抖音跳舞不用真人出鏡,一張照片就能產生高品質影片!位元組新科技連抱抱臉CTO都下場體驗了

One More Thing

不得不說,像MagicAnimate這樣的項目最近真的非常受歡迎

這不,在它“出道”前不久,阿里團隊也發布了一個名叫Animate Anyone的項目,同樣是只要「一張圖」和「想要的動作」:

抖音跳舞不用真人出鏡,一張照片就能產生高品質影片!位元組新科技連抱抱臉CTO都下場體驗了

由此,也有網友提出了疑問:

這似乎是MagicAnimate和AnimateAnyone之間的戰爭。 誰更勝一籌?

抖音跳舞不用真人出鏡,一張照片就能產生高品質影片!位元組新科技連抱抱臉CTO都下場體驗了

你覺得呢?

請點選以下連結查看論文:https://arxiv.org/abs/2311.16498

以上是抖音跳舞不用真人出鏡,一張照片就能產生高品質影片!位元組新科技連抱抱臉CTO都下場體驗了的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
AI技能差距正在減慢供應鏈AI技能差距正在減慢供應鏈Apr 26, 2025 am 11:13 AM

經常使用“ AI-Ready勞動力”一詞,但是在供應鏈行業中確實意味著什麼? 供應鏈管理協會(ASCM)首席執行官安倍·埃什肯納齊(Abe Eshkenazi)表示,它表示能夠評論家的專業人員

一家公司如何悄悄地努力改變AI一家公司如何悄悄地努力改變AIApr 26, 2025 am 11:12 AM

分散的AI革命正在悄悄地獲得動力。 本週五在德克薩斯州奧斯汀,Bittensor最終遊戲峰會標誌著一個關鍵時刻,將分散的AI(DEAI)從理論轉變為實際應用。 與閃閃發光的廣告不同

NVIDIA釋放NEMO微服務以簡化AI代理開發NVIDIA釋放NEMO微服務以簡化AI代理開發Apr 26, 2025 am 11:11 AM

企業AI面臨數據集成挑戰 企業AI的應用面臨一項重大挑戰:構建能夠通過持續學習業務數據來保持準確性和實用性的系統。 NeMo微服務通過創建Nvidia所描述的“數據飛輪”來解決這個問題,允許AI系統通過持續接觸企業信息和用戶互動來保持相關性。 這個新推出的工具包包含五個關鍵微服務: NeMo Customizer 處理大型語言模型的微調,具有更高的訓練吞吐量。 NeMo Evaluator 提供針對自定義基準的AI模型簡化評估。 NeMo Guardrails 實施安全控制,以保持合規性和適當的

AI為藝術與設計的未來描繪了一幅新圖片AI為藝術與設計的未來描繪了一幅新圖片Apr 26, 2025 am 11:10 AM

AI:藝術與設計的未來畫卷 人工智能(AI)正以前所未有的方式改變藝術與設計領域,其影響已不僅限於業餘愛好者,更深刻地波及專業人士。 AI生成的藝術作品和設計方案正在迅速取代傳統的素材圖片和許多交易性設計活動中的設計師,例如廣告、社交媒體圖片生成和網頁設計。 然而,專業藝術家和設計師也發現AI的實用價值。他們將AI作為輔助工具,探索新的美學可能性,融合不同的風格,創造新穎的視覺效果。 AI幫助藝術家和設計師自動化重複性任務,提出不同的設計元素並提供創意輸入。 AI支持風格遷移,即將一種圖像的風格應用

Zoom如何徹底改變與Agent AI的合作:從會議到里程碑Zoom如何徹底改變與Agent AI的合作:從會議到里程碑Apr 26, 2025 am 11:09 AM

Zoom最初以其視頻會議平台而聞名,它通過創新使用Agentic AI來引領工作場所革命。 最近與Zoom的CTO XD黃的對話揭示了該公司雄心勃勃的願景。 定義代理AI 黃d

對大學的存在威脅對大學的存在威脅Apr 26, 2025 am 11:08 AM

AI會徹底改變教育嗎? 這個問題是促使教育者和利益相關者的認真反思。 AI融入教育既提出了機遇和挑戰。 正如科技Edvocate的馬修·林奇(Matthew Lynch)所指出的那樣

原型:美國科學家正在國外尋找工作原型:美國科學家正在國外尋找工作Apr 26, 2025 am 11:07 AM

美國科學研究和技術發展或將面臨挑戰,這或許是由於預算削減導致的。據《自然》雜誌報導,2025年1月至3月期間,美國科學家申請海外工作的數量比2024年同期增加了32%。此前一項民意調查顯示,75%的受訪研究人員正在考慮前往歐洲和加拿大尋找工作。 過去幾個月,數百項NIH和NSF的撥款被終止,NIH今年的新撥款減少了約23億美元,下降幅度接近三分之一。洩露的預算提案顯示,特朗普政府正在考慮大幅削減科學機構的預算,削減幅度可能高達50%。 基礎研究領域的動盪也影響了美國的一大優勢:吸引海外人才。 35

所有有關打開AI最新的GPT 4.1家庭的信息 - 分析Vidhya所有有關打開AI最新的GPT 4.1家庭的信息 - 分析VidhyaApr 26, 2025 am 10:19 AM

Openai推出了強大的GPT-4.1系列:一個專為現實世界應用設計的三種高級語言模型家族。 這種巨大的飛躍提供了更快的響應時間,增強的理解和大幅降低了成本

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中

EditPlus 中文破解版

EditPlus 中文破解版

體積小,語法高亮,不支援程式碼提示功能

SecLists

SecLists

SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

WebStorm Mac版

WebStorm Mac版

好用的JavaScript開發工具