Video AI meletup lagi! Foto + suara bertukar menjadi video, Alibaba meminta heroin Sora menyanyi dan rap bersama Li Zi.-AI-php.cn

Rumah

Peranti teknologi

Video AI meletup lagi! Foto + suara bertukar menjadi video, Alibaba meminta heroin Sora menyanyi dan rap bersama Li Zi.

王林

Feb 29, 2024 pm 07:07 PM

aibunyifoto

Selepas Sora, sebenarnya ada model video AI baharu, yang menakjubkan dan membuatkan semua orang sukakannya!

Video AI meletup lagi! Foto + suara bertukar menjadi video, Alibaba meminta heroin Sora menyanyi dan rap bersama Li Zi. Gambar

Dengan itu, Gao Qiqiang, penjahat "Cepat" berubah menjadi Luo Xiang, dan dia boleh mendidik semua orang (kepala anjing).

Video AI meletup lagi! Foto + suara bertukar menjadi video, Alibaba meminta heroin Sora menyanyi dan rap bersama Li Zi.

Ini ialah rangka kerja penjanaan video potret dipacu audio terbaharu Alibaba, EMO (Emote Portrait Alive).

Dengannya, anda boleh menjana video AI dengan ekspresi yang jelas dengan memasukkan satu imej rujukan dan sekeping audio (ucapan, nyanyian atau rap). Panjang akhir video bergantung pada panjang audio input.

Anda boleh meminta Mona Lisa, peserta veteran pengalaman kesan AI, untuk membacakan monolog:

Video AI meletup lagi! Foto + suara bertukar menjadi video, Alibaba meminta heroin Sora menyanyi dan rap bersama Li Zi.

DiCaprio yang muda dan kacak melakukan persembahan bakat RAP pantas, dan bentuk mulutnya tidak dapat dikekalkan. sama sekali. Soalan:

Video AI meletup lagi! Foto + suara bertukar menjadi video, Alibaba meminta heroin Sora menyanyi dan rap bersama Li Zi.

saya pun boleh tahan penyegerakan bibir Kantonis, jadi saya minta abang saya Leslie Cheung menyanyikan lagu "Tanpa Syarat" Eason Chan:

Video AI meletup lagi! Foto + suara bertukar menjadi video, Alibaba meminta heroin Sora menyanyi dan rap bersama Li Zi.

Pendek kata, sama ada membiarkan potret itu menyanyi (gaya potret dan lagu yang berbeza), Biarkan potret bercakap (dalam bahasa berbeza), atau melakukan pelbagai persembahan silang pelakon Kesan EMO membuatkan kami terpegun seketika.

Netizen berseru: "Kami memasuki realiti baharu!"

Video AI meletup lagi! Foto + suara bertukar menjadi video, Alibaba meminta heroin Sora menyanyi dan rap bersama Li Zi. Versi 2019 "Joker" berkata barisan versi 2008 "The Dark Knight"

Sesetengah netizen telah mula menjana video EMO Tarik tab dan analisa kesan bingkai demi bingkai.

Seperti yang ditunjukkan dalam video di bawah, protagonis adalah wanita AI yang dijana oleh Sora Lagu yang dia nyanyikan untuk anda kali ini ialah "Jangan Mulakan Sekarang".

Tweeters dianalisis:

Konsistensi video ini lebih baik daripada sebelumnya!
Dalam video lebih daripada satu minit, cermin mata hitam di muka Cik Sora hampir tidak bergerak, dan telinga serta keningnya bergerak secara bebas.
Perkara yang paling mengujakan ialah tekak Cik Sora nampaknya benar-benar bernafas! Tubuhnya menggeletar dan bergerak sedikit semasa menyanyi, yang mengejutkan saya!

Video AI meletup lagi! Foto + suara bertukar menjadi video, Alibaba meminta heroin Sora menyanyi dan rap bersama Li Zi. Pictures

Setelah berkata, EMO adalah teknologi baharu yang hangat, dan tidak dapat dielakkan untuk membandingkannya dengan produk yang serupa -

Baru semalam, syarikat penjanaan video AI Pika turut melancarkan alih suara video aksara, dan ciri penyegerakan bibir "penyegerakan bibir", ranap.

Bagaimana dengan kesan spesifiknya kami akan letak di sini terus Video AI meletup lagi! Foto + suara bertukar menjadi video, Alibaba meminta heroin Sora menyanyi dan rap bersama Li Zi.

Selepas perbandingan, netizen di ruangan komen membuat kesimpulan bahawa mereka dipukul oleh Ali.

Video AI meletup lagi! Foto + suara bertukar menjadi video, Alibaba meminta heroin Sora menyanyi dan rap bersama Li Zi. Pictures

EMO mengeluarkan kertas itu dan mengumumkan ia adalah sumber terbuka.

Tetapi! Walaupun ia adalah sumber terbuka, masih terdapat kedudukan pendek pada GitHub.

Tetapi sekali lagi! Walaupun ia adalah kedudukan pendek, bilangan bintang telah melebihi 2.1k.

Video AI meletup lagi! Foto + suara bertukar menjadi video, Alibaba meminta heroin Sora menyanyi dan rap bersama Li Zi. Gambar

membuatkan netizen benar-benar cemas, cemas seperti Raja Gigi.

Video AI meletup lagi! Foto + suara bertukar menjadi video, Alibaba meminta heroin Sora menyanyi dan rap bersama Li Zi.

Senibina yang berbeza dari Sora

Sebaik sahaja kertas EMO keluar, ramai orang dalam bulatan itu menarik nafas lega.

Ia berbeza daripada laluan teknikal Sora, yang menunjukkan bahawa menyalin Sora bukan satu-satunya cara.

EMO tidak berdasarkan seni bina seperti DiT, iaitu, ia tidak menggunakan Transformer untuk menggantikan rangkaian tulang belakangnya yang diubah suai daripada Stable Diffusion 1.5.

Secara khusus, EMO ialah rangka kerja penjanaan video potret dipacu audio ekspresif yang boleh menjana video dalam sebarang tempoh berdasarkan panjang video input. .

Video AI meletup lagi! Foto + suara bertukar menjadi video, Alibaba meminta heroin Sora menyanyi dan rap bersama Li Zi. Peringkat resapan

Pertama, pengekod audio pra-latihan memproses pembenaman audio, dan topeng kawasan muka digabungkan dengan hingar berbilang bingkai untuk mengawal penjanaan imej muka.

Kemudian rangkaian tulang belakang mengetuai operasi denoising. Dua jenis perhatian digunakan dalam rangkaian tulang belakang, perhatian rujukan dan perhatian audio, yang berfungsi untuk mengekalkan konsistensi identiti watak dan mengawal pergerakan watak masing-masing.

Selain itu, modul masa digunakan untuk memanipulasi dimensi masa dan melaraskan kelajuan pergerakan.

Dari segi data latihan, pasukan membina set data audio dan video yang besar dan pelbagai yang mengandungi lebih daripada 250 jam video dan lebih daripada 15 juta imej.

Ciri-ciri khusus pelaksanaan akhir adalah seperti berikut:

Boleh menjana video dalam mana-mana tempoh berdasarkan audio input sambil memastikan konsistensi identiti watak (video tunggal terpanjang yang diberikan dalam demonstrasi ialah 1 minit dan 49 saat).

Menyokong bercakap dan menyanyi dalam pelbagai bahasa (demo termasuk Mandarin, Kantonis, Inggeris, Jepun, Korea)

Menyokong gaya lukisan yang berbeza (foto, lukisan tradisional, komik, rendering 3D, orang digital AI)

Gambar

Gambar

Berbanding dengan kaedah lain yang tidak bergantung pada model penyebaran, EMO lebih memakan masa.

Video AI meletup lagi! Foto + suara bertukar menjadi video, Alibaba meminta heroin Sora menyanyi dan rap bersama Li Zi. Dan memandangkan tiada isyarat kawalan eksplisit digunakan, yang mungkin membawa kepada penghasilan bahagian badan lain yang tidak disengajakan seperti tangan, penyelesaian yang berpotensi adalah menggunakan isyarat kawalan khusus untuk bahagian badan. Pasukan EMO

Akhir sekali, mari kita lihat orang dalam pasukan di belakang EMO.

Kertas menunjukkan bahawa pasukan EMO berasal dari Institut Penyelidikan Pengkomputeran Pintar Alibaba. Video AI meletup lagi! Foto + suara bertukar menjadi video, Alibaba meminta heroin Sora menyanyi dan rap bersama Li Zi. Terdapat empat pengarang iaitu Linrui Tian, Qi Wang, Bang Zhang dan Liefeng Bo.

Gambar

Antaranya, Liefeng Bo ialah ketua makmal XR Makmal Alibaba Tongyi sekarang.

Dr. Bo Liefeng lulus dari Universiti Sains dan Teknologi Elektronik Xi'an Beliau telah terlibat dalam penyelidikan pasca doktoral di Toyota Research Institute of the University of Chicago dan University of Washington. Petikan Google Scholarnya melebihi 13,000.

Sebelum menyertai Alibaba, beliau mula-mula berkhidmat sebagai ketua saintis di ibu pejabat Amazon di Seattle, dan kemudian menyertai makmal AI JD Digital Technology Group sebagai ketua saintis.

Pada September 2022, Bo Liefeng menyertai Alibaba.

Video AI meletup lagi! Foto + suara bertukar menjadi video, Alibaba meminta heroin Sora menyanyi dan rap bersama Li Zi. Pictures

EMO bukanlah kali pertama Alibaba mencapai kejayaan dalam bidang AIGC.

Gambar

OutfitSesiapa sahaja dengan AI menukar pakaian satu klik.

Video AI meletup lagi! Foto + suara bertukar menjadi video, Alibaba meminta heroin Sora menyanyi dan rap bersama Li Zi. Gambar

Selain itu, AnimateAnyone membuat kucing dan anjing di seluruh dunia menari tarian mandi.

Video AI meletup lagi! Foto + suara bertukar menjadi video, Alibaba meminta heroin Sora menyanyi dan rap bersama Li Zi. Ini adalah yang di bawah:

Gambar

Video AI meletup lagi! Foto + suara bertukar menjadi video, Alibaba meminta heroin Sora menyanyi dan rap bersama Li Zi. Sekarang EMO dilancarkan, ramai netizen mengeluh bahawa Alibaba telah mengumpulkan beberapa teknologi padanya.

Video AI meletup lagi! Foto + suara bertukar menjadi video, Alibaba meminta heroin Sora menyanyi dan rap bersama Li Zi. Gambar

Jika semua teknologi ini digabungkan sekarang, kesannya...

Saya tidak berani memikirkannya, tetapi saya menantikannya.

Video AI meletup lagi! Foto + suara bertukar menjadi video, Alibaba meminta heroin Sora menyanyi dan rap bersama Li Zi. Pictures

Ringkasnya, kami semakin hampir untuk "menghantar skrip kepada AI dan mengeluarkan keseluruhan filem".

Video AI meletup lagi! Foto + suara bertukar menjadi video, Alibaba meminta heroin Sora menyanyi dan rap bersama Li Zi. Pictures

One More Thing

Sora, mewakili satu kejayaan dalam sintesis video dipacu teks.

EMO juga mewakili tahap baharu sintesis video dipacu audio.

Walaupun kedua-duanya mempunyai tugas dan seni bina khusus yang berbeza, mereka masih mempunyai satu persamaan penting:

Tiada model fizikal eksplisit di tengah, tetapi kedua-duanya mensimulasikan undang-undang fizikal pada tahap tertentu.

Jadi sesetengah orang berpendapat bahawa ini bertentangan dengan desakan Lecun bahawa "memodelkan dunia untuk tindakan dengan menjana piksel adalah membazir dan ditakdirkan untuk gagal", dan menyokong idea "model dunia dipacu data" Jim Fan.

Video AI meletup lagi! Foto + suara bertukar menjadi video, Alibaba meminta heroin Sora menyanyi dan rap bersama Li Zi. Gambar

Pelbagai kaedah telah gagal pada masa lalu, tetapi kejayaan semasa mungkin benar-benar datang dari "Pelajaran Pahit" yang ditulis oleh Sutton, bapa pembelajaran pengukuhan, di mana usaha yang hebat boleh menghasilkan keajaiban.

Dayakan AI menemui seperti orang, bukannya mengandungi perkara yang orang temui

Kemajuan terobosan akhirnya dicapai dengan mengembangkan skala pengkomputeran

Kertas: https://www.php.cn/link/a717f6b706f9c41b706f9c41b706f itHub :https://www.php.cn/link/e43a09ffc30b44cb1f0db46f87836f40

Pautan rujukan:

[1]
https://www.php.cn/link /0dd4f2526c7c5c2526c36c5f2526c

Atas ialah kandungan terperinci Video AI meletup lagi! Foto + suara bertukar menjadi video, Alibaba meminta heroin Sora menyanyi dan rap bersama Li Zi.. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan

Artikel ini dikembalikan pada:51CTO.COM. Jika ada pelanggaran, sila hubungi admin@php.cn Padam

Artikel Berkaitan

ai合并图层的快捷键是什么Jan 07, 2021 am 10:59 AM

ai合并图层的快捷键是“Ctrl+Shift+E”，它的作用是把目前所有处在显示状态的图层合并，在隐藏状态的图层则不作变动。也可以选中要合并的图层，在菜单栏中依次点击“窗口”-“路径查找器”，点击“合并”按钮。

ai橡皮擦擦不掉东西怎么办Jan 13, 2021 am 10:23 AM

ai橡皮擦擦不掉东西是因为AI是矢量图软件，用橡皮擦不能擦位图的，其解决办法就是用蒙板工具以及钢笔勾好路径再建立蒙板即可实现擦掉东西。

谷歌超强AI超算碾压英伟达A100！TPU v4性能提升10倍，细节首次公开Apr 07, 2023 pm 02:54 PM

虽然谷歌早在2020年，就在自家的数据中心上部署了当时最强的AI芯片——TPU v4。但直到今年的4月4日，谷歌才首次公布了这台AI超算的技术细节。论文地址：https://arxiv.org/abs/2304.01433相比于TPU v3，TPU v4的性能要高出2.1倍，而在整合4096个芯片之后，超算的性能更是提升了10倍。另外，谷歌还声称，自家芯片要比英伟达A100更快、更节能。与A100对打，速度快1.7倍论文中，谷歌表示，对于规模相当的系统，TPU v4可以提供比英伟达A100强1.

ai可以转成psd格式吗Feb 22, 2023 pm 05:56 PM

ai可以转成psd格式。转换方法：1、打开Adobe Illustrator软件，依次点击顶部菜单栏的“文件”-“打开”，选择所需的ai文件；2、点击右侧功能面板中的“图层”，点击三杠图标，在弹出的选项中选择“释放到图层（顺序）”；3、依次点击顶部菜单栏的“文件”-“导出”-“导出为”；4、在弹出的“导出”对话框中，将“保存类型”设置为“PSD格式”，点击“导出”即可；

ai顶部属性栏不见了怎么办Feb 22, 2023 pm 05:27 PM

ai顶部属性栏不见了的解决办法：1、开启Ai新建画布，进入绘图页面；2、在Ai顶部菜单栏中点击“窗口”；3、在系统弹出的窗口菜单页面中点击“控制”，然后开启“控制”窗口即可显示出属性栏。

GPT-4的研究路径没有前途？Yann LeCun给自回归判了死刑Apr 04, 2023 am 11:55 AM

Yann LeCun 这个观点的确有些大胆。「从现在起 5 年内，没有哪个头脑正常的人会使用自回归模型。」最近，图灵奖得主 Yann LeCun 给一场辩论做了个特别的开场。而他口中的自回归，正是当前爆红的 GPT 家族模型所依赖的学习范式。当然，被 Yann LeCun 指出问题的不只是自回归模型。在他看来，当前整个的机器学习领域都面临巨大挑战。这场辩论的主题为「Do large language models need sensory grounding for meaning and u

AI抢饭碗成真！近500家美国企业用ChatGPT取代员工，有公司省下超10万美元Apr 07, 2023 pm 02:57 PM

自从ChatGPT掀起浪潮，不少人都在担心AI快要抢人类饭碗了。然鹅，现实可能更残酷QAQ......据就业服务平台Resume Builder调查统计，在1000多家受访美国企业中，用ChatGPT取代部分员工的，比例已达到惊人的48%。在这些企业中，有49%已经启用ChatGPT，还有30%正在赶来的路上。就连央视财经也为此专门发过一个报道：相关话题还曾一度冲上了知乎热榜，众网友表示，不得不承认，现在ChatGPT等AIGC工具已势不可挡——浪潮既来，不进则退。有程序员还指出：用过Copil

ai移动不了东西了怎么办Mar 07, 2023 am 10:03 AM

ai移动不了东西的解决办法：1、打开ai软件，打开空白文档；2、选择矩形工具，在文档中绘制矩形；3、点击选择工具，移动文档中的矩形；4、点击图层按钮，弹出图层面板对话框，解锁图层；5、点击选择工具，移动矩形即可。

See all articles

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

Menjana ai hentai secara percuma.

Tunjukkan Lagi

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)

3 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Tetapan grafik terbaik

3 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Penyelesaian Riddle Seashell

1 minggu yang laluByDDD

R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa

3 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌

Di mana untuk mencari kad kunci kawalan kren di atomfall

1 minggu yang laluByDDD

Tunjukkan Lagi

Alat panas

Dreamweaver CS6

Alat pembangunan web visual

MantisBT

Mantis ialah alat pengesan kecacatan berasaskan web yang mudah digunakan yang direka untuk membantu dalam pengesanan kecacatan produk. Ia memerlukan PHP, MySQL dan pelayan web. Lihat perkhidmatan demo dan pengehosan kami.

ZendStudio 13.5.1 Mac

Persekitaran pembangunan bersepadu PHP yang berkuasa

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

DVWA

Damn Vulnerable Web App (DVWA) ialah aplikasi web PHP/MySQL yang sangat terdedah. Matlamat utamanya adalah untuk menjadi bantuan bagi profesional keselamatan untuk menguji kemahiran dan alatan mereka dalam persekitaran undang-undang, untuk membantu pembangun web lebih memahami proses mengamankan aplikasi web, dan untuk membantu guru/pelajar mengajar/belajar dalam persekitaran bilik darjah Aplikasi web keselamatan. Matlamat DVWA adalah untuk mempraktikkan beberapa kelemahan web yang paling biasa melalui antara muka yang mudah dan mudah, dengan pelbagai tahap kesukaran. Sila ambil perhatian bahawa perisian ini

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

7444

Tutorial CakePHP

1371

Apakah format nama akaun stim

kunci pengaktifan win11 kekal

Sambungan NYT menunjukkan dan jawapan

Tunjukkan Lagi