Rumah > Artikel > Peranti teknologi > Morph Studio: Percuma, 1080P, perisian penyuntingan video kuda hitam berkuasa 7 saat akan datang
"Obor-obor yang bercahaya perlahan-lahan naik dari lautan," teruskan menaip apa yang anda mahu lihat di Morph Studio, "berubah menjadi buruj berkilauan di langit malam."
Selepas beberapa minit, Morph Studio menjana video pendek. Seekor obor-obor benar-benar lutsinar dan berkilauan, berputar dan meninggi, figura bergoyangnya berbeza dengan bintang di langit malam.
Obor-obor bercahaya naik dari laut yang mempesonakan, berubah menjadi bintang bergemerlapan di langit yang gelap
Masukkan "sinematik joker", dan wajah yang pernah menyapu dunia kembali.
Joaquin Phoenix menyampaikan persembahan hiper-realistik sebagai Joker dalam set syot sinematik di jalan-jalan bercahaya neon di New York Asap berkepul-kepul di sekelilingnya, menambahkan lagi suasana huru-hara dan kegelapan.
Baru-baru ini, Startup Morph Studio telah membuat kemas kini utama kepada teknologi dan komuniti penjanaan teks-ke-videonya. Model mereka telah melalui kemas kini yang besar, dan produksi video ini menunjukkan model yang dikemas kini dengan imej yang jelas dan butiran yang jelas.
Morph Studio ialah pasukan pertama di dunia yang melancarkan produk teks-ke-video secara terbuka untuk orang ramai menguji sesuka hati, lebih awal daripada Runway melancarkan Gen2 beta awam.
Berbanding dengan produk teks-ke-video popular lain, Morph Studio berbeza dari segi perkhidmatan percuma. Ia menawarkan resolusi 1080P lalai dan masa binaan maksimum 7 saat dari permulaan. Untuk produk teks ke video, peleraian yang lebih tinggi, masa penjanaan yang lebih lama dan ungkapan niat yang lebih baik ialah tiga petunjuk utama. Morph telah mencapai tahap terkini dalam industri dalam ketiga-tiga penunjuk ini.
Purata panjang satu tangkapan filem Hollywood ialah 6 saat Memanjangkan masa penjanaan kepada 7 saat boleh membuka kunci keperluan kreatif lebih ramai pengguna.
Mengalami model Morph Studio adalah mudah, anda boleh menggunakannya secara percuma dengan mendaftar di discord.
Model dengan perkataan "pro" dalam kotak merah pada skrin ialah model yang dikemas kini dan menjadi subjek pengalaman artikel ini.
Pergerakan kamera ialah bahasa asas penghasilan video dan peranti naratif yang berkuasa. Morph menyediakan beberapa bahasa kamera umum, termasuk zum, sorot (atas, bawah, kiri, kanan), putaran (mengikut arah jam atau lawan jam), dan tangkapan pegun.
Morph juga menyediakan fungsi MOTION (1-10) untuk mengawal pergerakan video. Semakin besar nilai, semakin ganas dan melebihkan tindakan Semakin kecil nilainya, semakin halus dan lancar tindakan itu.
Kadar bingkai (FPS) menyediakan julat pelarasan dari 8 -30 Semakin tinggi nilai, semakin lancar video dan semakin besar saiznya. Sebagai contoh, -FPS 30 akan menghasilkan video yang paling lancar tetapi juga terbesar. Secara lalai, semua video dibuat pada 24 bingkai sesaat.
Panjang video lalai ialah 3 saat Untuk menjana video 7 saat, anda boleh memasukkan -s 7 dalam arahan. Selain itu, model ini menawarkan 5 nisbah video untuk dipilih.
Jika anda mempunyai keperluan untuk butiran seperti kanta, kadar bingkai dan panjang video, sila teruskan memasukkan parameter yang sepadan selepas memasukkan gesaan kandungan. (Pada masa ini hanya input bahasa Inggeris disokong.)
Kami mengalami perkhidmatan model yang dikemas kini dan sangat merasakan kejutan visual yang dibawa oleh 1080P.
Sehingga baru-baru ini, manusia mempunyai foto pertama harimau salji berjalan di bawah bintang:
Foto pertama harimau salji berjalan di bawah bintang.
Kami ingin tahu, bolehkah model Morph Studio menjana video haiwan yang agak jarang ini?
Dengan gesaan yang sama, kami meletakkan karya Morph Studio di bahagian atas video dan karya yang dihasilkan dengan Pika di bahagian bawah video.
harimau salji berjalan di bawah malam berbintang, realistik sinematik, sangat terperinci, -gerakan 10, -ar 16:9, -zum masuk, -pan ke atas, -fps 30, -s 7. negatif: Anggota badan tambahan, Tangan dan kaki hilang, jari dan kaki bercantum, jari tambahan, cacat
Helaian jawapan Morph Studio mempunyai pemahaman teks yang tepat. Dalam gambar 1080P, rambut harimau salji kaya dengan perincian dan seperti hidup. Bima Sakti dan bintang boleh dilihat di latar belakang. Walau bagaimanapun, pergerakan harimau salji tidak jelas.
Dalam kerja rumah Pika, harimau bintang salji memang berjalan, tetapi langit malam seolah-olah difahami sebagai malam dengan kepingan salji yang tebal. Masih terdapat jurang dari segi gaya Snow Leopard, butiran dan kejelasan gambar.
Mari kita lihat semula kesan penjanaan watak.
masterpiece kualiti terbaik video RAW terperinci ultra 1gadis solo menari lukisan digital gadis cyborg cantik berumur 21 tahun rambut merah berombak panjang berambut biru mata halus kulit putih pucat badan sempurna menyanyi di bawah cahaya subuh yang menakutkan selepas kiamat
Morph Dalam karya yang dihasilkan oleh Studio, resolusi tinggi membawa kontur muka dan ekspresi mikro yang sangat halus, dan di bawah cahaya fajar, butiran rambut jelas kelihatan.
Tertakluk kepada kekurangan resolusi, warna dan tahap cahaya, gambaran keseluruhan yang dihasilkan oleh Pika adalah kebiruan, dan butiran wajah watak-watak tersebut tidak memuaskan.
Manusia dan haiwan semuanya pernah mengalaminya, mari kita lihat kesan penjanaan bangunan (benda buatan manusia).
La torre eifel starry night van gogh epik bergaya kompleks seni halus warna dalam mengalir fky bergerak awan
Berbanding dengan karya Pika, yang lebih seperti lukisan, karya Morph Studio mengimbangi elemen Van Gogh dengan lebih baik Dan elemen realistik , paras cahaya sangat kaya, terutamanya butiran yang mengalir dari lautan awan, dan langit dalam karya Pika hampir statik.
Akhir sekali, alami penciptaan pemandangan semula jadi. .
Disebabkan kekurangan tahap cahaya dan bayang yang halus, video yang dihasilkan oleh Pika membuatkan ombak dan pantai kelihatan rata, dan pergerakan ombak yang melanda pantai agak kusam.
Selain pengalaman mengejutkan yang dibawa oleh resolusi tinggi, dengan gesaan yang sama untuk menjana video (seperti haiwan, bangunan, manusia dan tema pemandangan semula jadi), lawan akan lebih kurang "terlepas" dalam tugas generasi tertentu, dan Morph Studio berprestasi agak baik Ia lebih stabil, mempunyai kes sudut yang agak sedikit dan boleh meramalkan niat pengguna dengan lebih tepat.
Dari awal, pemahaman permulaan ini tentang Vincent Video ialah video itu mesti dapat menerangkan input pengguna dengan sangat tepat, dan semua kerja pengoptimuman juga bergerak ke arah ini. Struktur model Morph Studio mempunyai pemahaman yang lebih mendalam tentang niat teks Kemas kini ini telah membuat beberapa perubahan struktur dan membuat anotasi yang lebih terperinci untuk sesetengah data.
Selain keupayaan pemahaman teks yang agak baik, pemprosesan terperinci gambar tidak dihalang oleh output resolusi tinggi. Malah, selepas model dikemas kini, kandungan tindakan pada skrin lebih kaya, yang juga ditunjukkan dalam karya yang kami hasilkan menggunakan Morph Studio.
Apabila "Gadis Bersubang Mutiara" menggerakkan kepalanya, anting-anting itu juga sedikit bergegar; juga baik.
1080P bermakna model perlu memproses lebih banyak piksel, yang membawa cabaran yang lebih besar kepada penjanaan perincian Walau bagaimanapun, berdasarkan keputusan, bukan sahaja gambar tidak runtuh, tetapi ia lebih ekspresif kerana tahap butiran yang kaya. .
Ini ialah satu set landskap semula jadi yang kami hasilkan menggunakan model, termasuk ombak besar yang menakjubkan dan letusan gunung berapi, serta gambar bunga yang halus.
Output resolusi tinggi membawa keseronokan visual yang lebih baik kepada pengguna, tetapi ia juga memanjangkan masa output model dan menjejaskan pengalaman.
Morph Studio kini menjana video 1080p dalam masa 3 setengah minit, iaitu kelajuan yang sama seperti video 720P Pika. Syarikat permulaan mempunyai sumber pengkomputeran yang terhad, jadi tidak mudah bagi Morph Studio untuk mengekalkan SOTA.
Selain itu, dari segi gaya video, selain realisme filem, model Morph Studio juga menyokong gaya biasa seperti komik dan animasi 3D.
Morph Studio memfokuskan pada teknologi teks-ke-video dan dianggap sebagai peringkat seterusnya dalam persaingan industri AI.
"Video segera mungkin mewakili lonjakan seterusnya dalam teknologi AI," kata New York Times dalam tajuk laporan teknologi, dengan alasan bahawa ia akan menjadi sama pentingnya dengan pelayar web dan iPhone.
Pada bulan September 2022, pasukan jurutera pembelajaran mesin Meta melancarkan sistem baharu yang dipanggil Make-A-Video Pengguna memasukkan penerangan kasar tempat kejadian, dan sistem akan menghasilkan video pendek yang sepadan.
Pada November 2022, penyelidik dari Tsinghua University dan Beijing Academy of Artificial Intelligence (BAAI) turut mengeluarkan CogVideo.
Pada masa itu, video yang dihasilkan oleh model ini bukan sahaja kabur (contohnya, resolusi video yang dihasilkan oleh CogVideo hanya 480 x 480), gambar juga agak herot, dan terdapat banyak batasan teknikal. Tetapi mereka masih mewakili perkembangan penting dalam penjanaan kandungan AI.
Pada zahirnya, video hanyalah satu siri bingkai (imej pegun) yang disatukan dengan cara yang memberikan ilusi pergerakan. Walau bagaimanapun, adalah lebih sukar untuk memastikan ketekalan satu siri imej dalam masa dan ruang.
Kemunculan model resapan telah mempercepatkan evolusi teknologi. Penyelidik telah cuba untuk membuat generalisasi model resapan kepada domain lain seperti audio, 3D dan video, dan teknologi sintesis video telah mencapai kemajuan yang ketara.
Teknologi berdasarkan model penyebaran terutamanya membolehkan rangkaian saraf mempelajari beberapa corak secara automatik dengan menyusun imej besar-besaran, video dan penerangan teks. Apabila anda memasukkan keperluan kandungan, rangkaian saraf menjana senarai semua ciri yang difikirkannya mungkin digunakan untuk mencipta imej (fikirkan garis besar telinga kucing, tepi telefon).
Kemudian, rangkaian saraf kedua (juga dikenali sebagai model resapan) bertanggungjawab untuk mencipta imej dan menjana piksel yang diperlukan untuk ciri ini dan menukar piksel kepada imej yang koheren.
Dengan menganalisis beribu-ribu video, AI boleh belajar menggabungkan banyak imej pegun dengan cara yang sama koheren. Kuncinya adalah untuk melatih model yang benar-benar memahami perhubungan dan konsistensi antara setiap bingkai.
"Ini adalah salah satu teknologi paling mengagumkan yang kami bina dalam seratus tahun yang lalu," Ketua Pegawai Eksekutif Runway Cristóbal Valenzuela pernah memberitahu media, "Anda perlu menarik orang ramai untuk menggunakannya."
2023 dianggap oleh sesetengah pihak dalam industri sebagai tahun kejayaan untuk sintesis video. Tiada model teks-ke-video awam pada bulan Januari, dan menjelang akhir tahun terdapat berpuluh-puluh produk serupa dan berjuta-juta pengguna.
Rakan kongsi a16z Justine Moore berkongsi garis masa model video Vincent di platform sosial, kita dapat melihat bahawa selain pengeluar besar, terdapat banyak syarikat permulaan sangat pantas.
Video semasa yang dijana AI tidak membentuk paradigma teknikal yang bersatu dan jelas seperti LLM Industri ini masih dalam peringkat penerokaan tentang cara menjana video yang stabil. Tetapi para penyelidik percaya kelemahan ini boleh dihapuskan kerana sistem mereka dilatih dengan lebih banyak data. Akhirnya, teknologi ini akan menjadikan pembuatan video semudah menulis ayat.
Seorang pelabur kanan industri AI domestik memberitahu kami bahawa beberapa kertas kerja terpenting mengenai Teknologi Video Vincent telah diterbitkan pada Julai-Ogos 2022. Sebagai analogi dengan proses perindustrian Vincent Video, teknologi ini hampir dengan industri Transformasi nod akan muncul setahun kemudian, iaitu, Julai-Ogos 2023.
Keseluruhan teknologi video berkembang dengan sangat pantas, dan teknologi ini menjadi semakin matang, pelabur ini berkata berdasarkan pengalaman pelaburan terdahulu dalam bidang GAN, mereka meramalkan bahawa teknologi teks ke video akan menjadi produk dalam tempoh enam bulan hingga satu tahun.
Pasukan Morph menghimpunkan penyelidik muda terbaik dalam bidang penjanaan video Selepas penyelidikan dan pembangunan intensif siang dan malam sepanjang tahun lalu, pengasas Xu Huaizhe, bersama pengasas bersama Li Feng, Yin Zixin, Zhao Shihao. , Liu Shaoteng dan tulang belakang teknikal teras lain, telah mengatasi teka-teki penjanaan video AI.
Selain pasukan teknikal, Morph Studio juga baru-baru ini telah mengukuhkan pasukan produknya, Hexin, penerbit kontrak Maoyan Films, hakim Festival Filem Antarabangsa Shanghai, dan ahli teras bekas syarikat AIGC di Silicon. Valley, juga baru-baru ini menyertai Morph Studio.
Haising berkata bahawa Morph Studio menduduki kedudukan utama dalam keseluruhan industri dari segi penyelidikan teknikal, pasukan itu rata, kecekapan komunikasi dan pelaksanaan sangat tinggi; Impian terbesarnya ialah untuk menyertai sebuah syarikat animasi. Selepas kemunculan era AI, dia dengan cepat menyedari bahawa industri animasi akan berubah pada masa hadapan Dalam beberapa dekad yang lalu, asas animasi adalah enjin 3D, dan era baru enjin AI akan datang tidak lama lagi. Pixar masa depan akan dilahirkan dalam syarikat AI. Dan Morph adalah pilihannya.
Pengasas Xu Huaizhe berkata bahawa Morph sedang aktif menyusun trek video AI Kami berazam untuk menjadi Super App dalam era video AI dan merealisasikan impian untuk pengguna.
Trek itu akan mempunyai detik Pertengahan Perjalanannya sendiri pada 2024, tambahnya.
PS: Untuk merasai keseronokan asal penjanaan video 1080P percuma, sila ke:
https://discord.com/invite/VVqS8QnBkA
Atas ialah kandungan terperinci Morph Studio: Percuma, 1080P, perisian penyuntingan video kuda hitam berkuasa 7 saat akan datang. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!