Rumah > Artikel > Peranti teknologi > Landasan dan Luma bergaduh lagi! Yann LeCun menyerang: Tidak kira betapa hebatnya anda, anda bukan 'model dunia'
Laporan Kuasa Mesin masih tidak tahu cara menggunakannya. Industri video AI "berperang" lagi! Pada 29 Jun, platform AI generatif yang terkenal Runway mengumumkan bahawa model terbaharu Gen-3 Alpha telah mula menguji beberapa pengguna.
Ini sangat menggembirakan netizen, "Jun, bulan yang indah!"
"Mei yang gila, Jun yang gila, sangat gila sehingga saya tidak boleh berhenti!"
-1- Runway membunuh HollywoodDua minggu lalu, apabila video AI "King" Runway melancarkan model generasi video baharu Gen-3 Alpha, ia Pratonton -
dahulu tersedia kepada pengguna yang membayar "dalam beberapa hari", dan versi percuma juga akan dibuka kepada semua pengguna pada satu ketika pada masa hadapan.
Pada 29 Jun, Runway memenuhi janjinya dan mengumumkan bahawa Gen-3 Alpha terbarunya akan tersedia untuk ujian kepada sesetengah pengguna.
Apakah kesan Gen-3 Alpha? Netizen yang terlibat dalam gubahan bunga selalunya paling banyak bersuara. Seterusnya, sila nikmati -
Rakaman filem raksasa yang menakutkan yang muncul dari Sungai Thames di London:
Seekor teddy bear yang sedih menangis, menangis sehingga dia sedih dan menghembus hidungnya dengan tisu:
Seorang gadis Inggeris dalam pakaian cantik berjalan di jalan di mana istana berdiri, dengan kenderaan laju dan kuda perlahan di sebelahnya:
Seekor cicak besar, bertatahkan barang kemas dan mutiara yang cantik, berjalan melalui tumbuh-tumbuhan Lebat. Cicak berkilauan dalam cahaya, dan rakamannya adalah realistik seperti dokumentari.Terdapat juga seekor katak bertatahkan berlian yang dilitupi delima dan nilam:
Di jalan-jalan bandar pada waktu malam, hujan memantulkan cahaya neon.
Kamera bermula daripada cahaya yang dipantulkan dalam lopak, perlahan-lahan naik untuk menunjukkan papan iklan neon yang bercahaya, dan kemudian terus mengezum kembali untuk menunjukkan keseluruhan jalan yang dibasahi hujan.
Pergerakan kamera: mula-mula menyasarkan pantulan di dalam lopak, kemudian mengangkatnya dan menariknya semula sekali gus untuk menunjukkan pemandangan bandar pada malam hujan ini.
Pautan video: https://www.php.cn/link/dbf138511ed1d9278bde43cc0000e49a
Acuan kuning yang tumbuh di dalam cawan petri, di bawah cahaya yang penuh dengan cahaya malap dan kelam.
Di dalam hutan musim luruh, tanah ditutup dengan pelbagai daun oren, kuning dan merah yang gugur.
Angin sepoi-sepoi bertiup, dan kamera bergerak ke hadapan dekat dengan tanah Pusaran angin mula terbentuk, mengambil daun-daun yang gugur dan membentuk lingkaran. Kamera naik dengan daun yang gugur dan berputar di sekeliling lajur daun yang berputar.
Pautan video: https://www.php.cn/link/dbf138511ed1d9278bde43cc0000e49a
Bermula dari perspektif rendah grafiti, yang dilitupi kamera di sepanjang jalan yang gelap dan gelap bahagian terowong, kamera dengan cepat naik apabila ia kelihatan di sisi lain, menunjukkan bidang besar bunga liar berwarna-warni yang dikelilingi oleh gunung yang dilitupi salji.
Pautan video: https://www.php.cn/link/dbf138511ed1d9278bde43cc0000e49a
Satu pukulan dekat bermain piano, jari-jari sahaja yang melompat-lompat, tidak ada pergerakan di atas kekunci kekurangannya ialah, tiada cincin di jari manis, tetapi bayang itu "keluar dari ketiadaan".
Netizen juga membawa keluar pengasas bersama Runway Cristóbal Valenzuela, yang menjana video untuk kamera lebah buatan sendiri.
Letakkan kamera di bahagian belakang lebah, dan pemandangan yang dirakam adalah seperti ini:
Pautan video: https://www.php.cn/link/dbf138511ed1d9278bde43cc9000bde43ccP muka lebah Ia berwarna ungu:
Pautan video:
https://www.php.cn/link/dbf138511ed1d9278bde43cc0000e49aJadi, bagaimana rupa kamera poket ini?
Jika AI terus berkembang seperti ini, pelakon Hollywood akan mogok lagi.
-2-Fungsi bingkai kunci baharu Luma, peralihan gambar yang lancar
Pada 29 Jun, Luma AI melancarkan fungsi bingkai kunci, dan dengan lambaian tangan anda, ia dibuka terus kepada semua pengguna secara percuma.
Pengguna hanya perlu memuat naik imej permulaan dan penamat serta menambah penerangan teks, dan Luma boleh menjana video kesan khas peringkat Hollywood.
Sebagai contoh, netizen X @hungrydonke memuat naik dua gambar bingkai utama:
.
|
|
Kemudian gunakan fungsi kerangka utama Luma untuk menjana animasi transformasi Super Saiyan. Menurut penulis, Luma tidak memerlukan gesaan naikkan kuasa, cuma masukkan "Super Saiyan".
Pautan video: https://www.php.cn/link/dbf138511ed1d9278bde43cc0000e49a
Sesetengah netizen menggunakan fungsi ini untuk melengkapkan peralihan setiap segmen dan tangkapan gambar klasik, di sana dengan mencampurkan setiap segmen dan tangkapan gambar. Animasi "The Wolf", The Warrior dan The Wardrobe".
Pautan video: https://www.php.cn/link/dbf138511ed1d9278bde43cc0000e49a
Syaitan bertukar menjadi malaikat:
:
Transformasi logo Starbucks:
Yann LeCun "Pengeboman": Mereka langsung tidak faham fizik
Apabila Sora dikeluarkan pada awal tahun, "model dunia" tiba-tiba menjadi konsep hangat.
Kemudian, Genie Google turut menggunakan sepanduk "model dunia". Apabila Runway melancarkan Gen-3 Alpha kali ini, pegawai itu berkata ia "mengambil langkah penting ke arah membina model dunia sejagat."
Apakah sebenarnya model dunia?
Sebenarnya, tiada definisi standard untuk ini, tetapi saintis AI percaya bahawa manusia dan haiwan akan secara halus memahami peraturan operasi dunia, supaya mereka boleh "meramalkan" apa yang akan berlaku seterusnya dan mengambil tindakan. Kajian model dunia adalah untuk membiarkan AI mempelajari keupayaan ini.
Ramai orang percaya bahawa video yang dihasilkan oleh aplikasi seperti Sora, Luma, dan Runway adalah agak realistik dan juga boleh menjana kandungan video baharu dalam susunan kronologi Mereka nampaknya telah mempelajari kebolehan untuk "meramalkan" perkembangan sesuatu. Ini bertepatan dengan matlamat yang dikejar oleh penyelidikan model dunia.
Walau bagaimanapun, pemenang Anugerah Turing Yann LeCun telah "menuangkan air sejuk".
Dia percaya, "Menghasilkan video yang kelihatan paling realistik berdasarkan gesaan tidak bermakna sistem memahami dunia fizikal, dan menjana ramalan sebab daripada model dunia adalah sangat berbeza
Pada 1 Julai, Yann LeCun menyiarkan 6 siaran berturut-turut Model Generatif untuk video pengeboman.
Dia mengetweet semula video gimnastik yang dijana AI. Watak-watak dalam video itu sama ada kepala mereka hilang dari udara nipis, atau empat kaki tiba-tiba muncul, dan semua jenis gambar pelik ada di mana-mana.
Pautan video:
https://www.php.cn/link/dbf138511ed1d9278bde43cc0000e49aYann LeCun berkata bahawa model penjanaan video badan manusia sahaja tidak memahami struktur asas fizikal manusia, tidak memahami struktur asas fizikal manusia.
"Sora dan model penjanaan video lain mempunyai masalah yang sama. Tidak dinafikan bahawa teknologi penjanaan video akan menjadi lebih maju dari masa ke masa, tetapi model dunia yang baik yang benar-benar memahami fizik tidak akan menjadi generatif "Semua burung dan mamalia memahami fizik lebih baik daripada mana-mana model penjanaan video, namun tiada satu pun daripada mereka boleh menjana video terperinci," kata Yann LeCun.
Sesetengah netizen mempersoalkan: Bukankah manusia sentiasa menjana "video" terperinci dalam fikiran mereka berdasarkan pemahaman mereka tentang fizik?
Yann LeCun menjawab soalan dalam talian, "Kami membayangkan senario abstrak yang mungkin berlaku, dan bukannya menjana imej piksel. Inilah perkara yang ingin saya nyatakan
Yann LeCun membalas: Tidak, mereka tidak. Mereka hanya menjana senario abstrak tentang perkara yang mungkin berlaku, yang sangat berbeza daripada menjana video terperinci.
Pada masa hadapan, kami akan membawa lebih banyak demonstrasi kes AIGC melalui lajur baharu, dan semua orang dialu-alukan untuk menyertai kumpulan untuk komunikasi.
Atas ialah kandungan terperinci Landasan dan Luma bergaduh lagi! Yann LeCun menyerang: Tidak kira betapa hebatnya anda, anda bukan 'model dunia'. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!