Rumah >Peranti teknologi >AI >Teknologi kecerdasan buatan Google 'Transframer' boleh mencipta video pendek berdasarkan gambar

Teknologi kecerdasan buatan Google 'Transframer' boleh mencipta video pendek berdasarkan gambar

WBOY
WBOYke hadapan
2023-04-21 10:40:081183semak imbas

Sambil teknologi berkembang, penyelidik terus mencari cara baharu untuk memanfaatkan kecerdasan buatan dan keupayaan pembelajaran mesin. Awal minggu ini, saintis Google mengumumkan penciptaan Transframer, rangka kerja baharu untuk menjana video pendek daripada satu input imej. Teknologi baharu ini suatu hari nanti boleh meningkatkan penyelesaian rendering tradisional dan membolehkan pembangun mencipta persekitaran maya berdasarkan keupayaan pembelajaran mesin.

Nama (dan dalam beberapa cara konsep) rangka kerja baharu ini adalah tanda terima kasih kepada Transformer, satu lagi model berasaskan AI. Mula-mula dilancarkan pada 2017, Transformer ialah seni bina rangkaian saraf baru yang mempunyai keupayaan untuk menjana teks dengan memodelkan dan membandingkan perkataan lain dalam ayat. Model itu telah dimasukkan ke dalam rangka kerja pembelajaran mendalam standard seperti TensorFlow dan PyTorch.

Dilaporkan bahawa Transframer menggunakan imej latar belakang dengan sifat yang serupa, digabungkan dengan anotasi pertanyaan, untuk membuat video pendek. Walaupun tiada data geometri disediakan dalam input imej mentah, video yang terhasil bergerak di sekitar imej sasaran dan menggambarkan perspektif yang tepat.

Teknologi kecerdasan buatan Google Transframer boleh mencipta video pendek berdasarkan gambar

​​

Teknologi baharu telah ditunjukkan menggunakan platform kecerdasan buatan DeepMind Google, yang menampilkan analisis Latar belakang foto tunggal imej digunakan untuk menangkap data imej utama dan menghasilkan imej tambahan. Semasa analisis ini, sistem menentukan bingkai imej, yang seterusnya membantu sistem meramalkan persekitaran imej.

Imej konteks kemudiannya digunakan untuk meramalkan lagi cara imej itu akan muncul dari sudut yang berbeza. Ramalan memodelkan kebarangkalian bingkai imej tambahan berdasarkan data, anotasi dan sebarang maklumat lain dalam bingkai kontekstual.

Teknologi kecerdasan buatan Google Transframer boleh mencipta video pendek berdasarkan gambar

Rangka kerja ini menandakan kemajuan besar dalam teknologi video dengan menyediakan keupayaan untuk menjana video yang agak tepat berdasarkan set data yang sangat terhad. Tugas Transframer juga menunjukkan hasil yang menjanjikan pada tugasan dan penanda aras berkaitan video lain, seperti pembahagian semantik, klasifikasi imej dan ramalan aliran optik.

Berkemungkinan besar memberi impak kepada industri berasaskan video seperti pembangunan permainan. Persekitaran pembangunan permainan semasa bergantung pada teknologi pemaparan teras seperti lorekan, pemetaan tekstur, kedalaman medan dan pengesanan sinar. Teknologi seperti Transframer mempunyai potensi untuk menawarkan pembangun laluan pembangunan baharu dengan menggunakan kecerdasan buatan dan pembelajaran mesin untuk membina persekitaran mereka dan pada masa yang sama mengurangkan masa, sumber dan usaha yang diperlukan untuk menciptanya.

Atas ialah kandungan terperinci Teknologi kecerdasan buatan Google 'Transframer' boleh mencipta video pendek berdasarkan gambar. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:51cto.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam