Teras keras untuk menyelesaikan pepijat fizik Sora! Empat universiti terkemuka di Amerika Syarikat dikeluarkan bersama: Pasang enjin fizik untuk penjana video-AI-php.cn

Teras keras untuk menyelesaikan pepijat fizik Sora! Empat universiti terkemuka di Amerika Syarikat dikeluarkan bersama: Pasang enjin fizik untuk penjana video

PHPz

May 07, 2024 pm 05:01 PM

gitfizikemulatorsora

Some Bugs muncul selepas Sora dibebaskan permainan muncul tanpa diduga.

Interaksi objek sangat penting untuk menjana realisme video, tetapi pada masa ini, masih sangat sukar untuk mensintesis kelakuan dinamik objek 3D sebenar dalam interaksi.

Action Conditioned Dynamics ialah bidang penyelidikan yang memerlukan persepsi sifat bahan fizikal objek dan ramalan gerakan 3D berdasarkan sifat ini (seperti kekakuan objek).

Menilai sifat bahan fizikal kekal sebagai masalah yang berduri dan tidak dapat diselesaikan kerana mengukur sifat bahan fizikal objek sebenar adalah amat sukar kerana kekurangan sokongan data.

Baru-baru ini, MIT, Universiti Stanford, Universiti Columbia dan Universiti Cornell bersama-sama mencadangkan model berasaskan fizik yang dipanggil PhysDreamer, yang menggunakan pembelajaran dinamik objek yang dipelajari oleh model penjanaan video untuk memberikan interaktiviti objek 3D statik.

Teras keras untuk menyelesaikan pepijat fizik Sora! Empat universiti terkemuka di Amerika Syarikat dikeluarkan bersama: Pasang enjin fizik untuk penjana video

Pautan kertas: https://arxiv.org/pdf/2404.13026.pdf

Laman utama projek: https://physdreamer.github.io/Bys

membolehkan objek sebenar bertindak balas kepada interaksi baru, seperti daya luaran atau manipulasi ejen, dan kajian pengguna digunakan untuk menilai realisme interaksi tersintesis dengan menunjukkan keberkesanan pendekatan pada contoh objek anjal yang berbeza.

Penyusunan Masalah

Diberi objek statik yang diwakili oleh Gaussian 3D Teras keras untuk menyelesaikan pepijat fizik Sora! Empat universiti terkemuka di Amerika Syarikat dikeluarkan bersama: Pasang enjin fizik untuk penjana video (di mana xp mewakili kedudukan, αp mewakili kelegapan, Σp mewakili matriks kovarians, dan cp mewakili zarah matlamat adalah untuk menganggar Medan sifat bahan fizikal objek untuk membolehkan sintesis gerakan interaktif yang realistik.

Sifat khusus termasuk jisim m, modulus Young E dan nisbah Poisson ν Modulus Young digunakan untuk mengukur kekukuhan bahan dan menentukan trajektori pergerakan objek sebagai tindak balas kepada daya luar: modulus Young yang lebih tinggi akan membawa. Untuk mencapai ubah bentuk yang lebih kecil, lebih ketegaran dan gerakan frekuensi yang lebih tinggi. . tanya modulus Young zarah untuk simulasi zarah.

Teras keras untuk menyelesaikan pepijat fizik Sora! Empat universiti terkemuka di Amerika Syarikat dikeluarkan bersama: Pasang enjin fizik untuk penjana video Bagi sifat fizikal lain, jisim m_p zarah boleh dikira sebagai hasil darab ketumpatan malar (ρ) dan isipadu zarah Vp boleh dikira dengan membahagikan "isipadu bagi unit latar belakang" dengan "bilangan zarah yang terkandung dalam unit" untuk dianggarkan; pengaruh nisbah Poisson νp pada gerakan objek boleh diabaikan dan boleh diandaikan sebagai malar. .

Memandangkan objek yang diwakili sebagai Gaussian 3D, mula-mula tunjukkannya dari sudut pandangan tertentu (dengan latar belakang), kemudian gunakan model penjanaan imej-ke-video untuk menjana video rujukan objek yang sedang bergerak, dan kemudian gunakan yang boleh dibezakan kaedah titik bahan ( MPM (Kaedah Titik Bahan) dan pemaparan boleh dibezakan, yang mengoptimumkan medan bahan yang berbeza-beza dari segi ruang dan medan halaju awal, bertujuan untuk meminimumkan perbezaan antara video yang dipaparkan dan video rujukan.

Teras keras untuk menyelesaikan pepijat fizik Sora! Empat universiti terkemuka di Amerika Syarikat dikeluarkan bersama: Pasang enjin fizik untuk penjana video Anak panah bertitik mewakili aliran kecerunan

3D Gaussian menggunakan set biji Gaussian 3D anisotropik untuk mewakili medan sinaran pemandangan 3D Walaupun ia diperkenalkan terutamanya sebagai kaedah sintesis paparan baharu 3D, ia boleh digunakan secara langsung kerana Gaussian 3D mempunyai sifat Lagrangian zarah.

Sama seperti kaedah PhysGaussian, penyelidik menggunakan kaedah titik bahan (MPM, Kaedah Titik Bahan) untuk mensimulasikan secara langsung dinamik objek pada zarah Gaussian.

Memandangkan taburan Gaussian 3D terletak terutamanya pada permukaan objek, proses pengisian dalaman pilihan boleh digunakan untuk meningkatkan realisme simulasi.

Mekanik kontinum dan bahan elastik

Dalam mekanik kontinum, ubah bentuk bahan disimulasikan melalui fungsi pemetaan ϕ, yang boleh memetakan ruang bahan dalam keadaan tidak berubah F Titik matriks Jacobian fungsi pemetaan ϕ, iaitu, kecerunan ubah bentuk adalah kunci untuk memahami dan menerangkan hubungan tegasan-tegangan bahan, yang melibatkan keadaan ubah bentuk tempatan bahan. Teras keras untuk menyelesaikan pepijat fizik Sora! Empat universiti terkemuka di Amerika Syarikat dikeluarkan bersama: Pasang enjin fizik untuk penjana video

Dalam bahan yang sangat anjal, pengiraan tegasan Cauchy (tegasan) bergantung pada fungsi ketumpatan tenaga terikan ψ(F), yang boleh mengukur tahap ubah bentuk tidak tegar bahan secara amnya, fungsi ini ditentukan oleh saintis bahan berdasarkan bahan Direka berdasarkan prinsip simetri dan invarian putaran dan dipadankan dengan data eksperimen. Teras keras untuk menyelesaikan pepijat fizik Sora! Empat universiti terkemuka di Amerika Syarikat dikeluarkan bersama: Pasang enjin fizik untuk penjana video

Selain itu, fungsi ketumpatan tenaga dalam model hiperelastik putaran tetap boleh diwakili oleh nilai tunggal σi bagi kecerunan ubah bentuk, dan parameter model μ dan λ mempunyai hubungan langsung dengan modulus Young E dan nisbah Poisson ν daripada bahan, Parameter ini penting untuk memahami bagaimana bahan berkelakuan apabila tertakluk kepada daya.

Material Point Method (MPM)

Teras keras untuk menyelesaikan pepijat fizik Sora! Empat universiti terkemuka di Amerika Syarikat dikeluarkan bersama: Pasang enjin fizik untuk penjana video

Penyelidik menggunakan Moving Least Squares Material Point Method (MLS-MPM) untuk menyelesaikan persamaan dinamik "govere material" mewakili ketumpatan, v(x, t) mewakili medan halaju ruang dunia, dan f mewakili daya luaran. Teras keras untuk menyelesaikan pepijat fizik Sora! Empat universiti terkemuka di Amerika Syarikat dikeluarkan bersama: Pasang enjin fizik untuk penjana video

MPM ialah kaedah pengiraan yang digunakan untuk mensimulasikan dinamik pelbagai bahan Ia menggabungkan kelebihan kaedah Euler dan Lagrangian dan amat sesuai untuk simulasi pepejal, cecair, pasir, kain dan bahan lain. mampu mengendalikan perubahan topologi dalam bahan dengan berkesan, dan mudah disejajarkan pada unit pemprosesan grafik (GPU).

Pendiskretan ruang dilakukan dengan menganggap objek sebagai satu siri zarah Gaussian Setiap zarah p mewakili sebahagian kecil daripada isipadu objek dan membawa sifat seperti isipadu, jisim, kedudukan, halaju, kecerunan ubah bentuk dan halaju setempat. kecerunan medan.

Teras keras untuk menyelesaikan pepijat fizik Sora! Empat universiti terkemuka di Amerika Syarikat dikeluarkan bersama: Pasang enjin fizik untuk penjana video

Proses pengiraan MPM termasuk gelung pemindahan zarah-ke-grid (P2G) dan grid-ke-zarah (G2P):

Dalam peringkat P2G, momentum dipindahkan daripada zarah ke grid, dan rangkaian dikemas kini .

Kaedah MPM boleh mensimulasikan tingkah laku dinamik kompleks bahan dengan tepat, termasuk ubah bentuk bahan, patah dan interaksi.

Para penyelidik menggunakan Kaedah Titik Bahan Kuasa Dua Bergerak (MLS-MPM) sebagai simulator fizikal dan model bahan hiperelastik putaran tetap untuk mensimulasikan proses objek tiga dimensi.

proses simulasi MLS-MPM

Simulator menggunakan MLS-MPM untuk mensimulasikan tingkah laku fizikal objek Fungsi simulasi menerima kedudukan zarah x, halaju v, kecerunan ubah bentuk F dan medan halaju setempat. langkah masa semasa t. Kecerunan C, serta set sifat fizikal zarah θ (termasuk jisim, modulus Young, nisbah Poisson dan isipadu semua zarah) dan langkah masa Δt (1×10^-4) diambil sebagai input, dan langkah seterusnya ialah output Nilai sepadan t+1.

Teras keras untuk menyelesaikan pepijat fizik Sora! Empat universiti terkemuka di Amerika Syarikat dikeluarkan bersama: Pasang enjin fizik untuk penjana video

Untuk mensimulasikan dinamik antara bingkai video bersebelahan, biasanya perlu mengulang ratusan sub-langkah.

Simulasi dan Rendering

Selepas simulasi, fungsi pemaparan boleh dibezakan Frender digunakan untuk menghasilkan zarah Gaussian bagi setiap bingkai, di mana Rt mewakili matriks putaran semua zarah yang diperoleh daripada simulasi

Teras keras untuk menyelesaikan pepijat fizik Sora! Empat universiti terkemuka di Amerika Syarikat dikeluarkan bersama: Pasang enjin fizik untuk penjana video

Kemudian video yang dijana digunakan sebagai rujukan untuk mengoptimumkan modulus E Young yang berbeza-beza secara spasial dan halaju awal v0 melalui fungsi kehilangan setiap bingkai, di mana fungsi kehilangan menggabungkan kehilangan L1 dan kehilangan D-SSIM, berat. Parameter λ ditetapkan kepada 0.1

Teras keras untuk menyelesaikan pepijat fizik Sora! Empat universiti terkemuka di Amerika Syarikat dikeluarkan bersama: Pasang enjin fizik untuk penjana video

Parameterisasi dan penyelarasan

Medan bahan dan medan halaju diparameterkan oleh dua triplanes dan tiga lapisan dalam pertambahan lapisan MLP (multilayer perpatis) kelancaran, penyelarasan jumlah variasi digunakan pada semua satah spatial kedua-dua medan ini.

Teras keras untuk menyelesaikan pepijat fizik Sora! Empat universiti terkemuka di Amerika Syarikat dikeluarkan bersama: Pasang enjin fizik untuk penjana video

Proses pengoptimuman

Proses pengoptimuman dibahagikan kepada dua peringkat untuk meningkatkan kestabilan dan mempercepatkan penumpuan:

dalam setiap modul yang pertama dimulakan dan ditetapkan secara rawak, dan kemudian hanya tiga bingkai pertama video rujukan digunakan untuk mengoptimumkan halaju awal setiap zarah.

2 Pada peringkat kedua, halaju awal ditetapkan dan modulus Young yang berbeza-beza secara spatial dioptimumkan. Untuk mengelakkan kecerunan daripada meletup atau hilang, isyarat kecerunan hanya mengalir ke bingkai sebelumnya.

Dengan cara ini, simulator dapat mensimulasikan tingkah laku fizikal objek dan mengoptimumkan sifat bahan dan keadaan awal berdasarkan video rujukan untuk menjana kesan dinamik yang realistik.

3. Mempercepatkan simulasi dengan pensubsampelan

Menggunakan zarah Gaussian tiga dimensi untuk pemaparan ketepatan tinggi biasanya memerlukan berjuta-juta zarah untuk mewakili pemandangan, yang membawa beban pengiraan yang besar untuk menjalankan simulasi.

Untuk meningkatkan kecekapan, model memperkenalkan proses subsampling, yang sangat mengurangkan jumlah pengiraan sambil mengekalkan ketepatan tinggi hasil pemaparan: hanya sebilangan kecil zarah pemacu digunakan untuk simulasi, dan kemudian melalui interpolasi Memacu zarah untuk mendapatkan kedudukan dan putaran zarah Gaussian secara berkesan mengimbangi kecekapan pengiraan dan kualiti pemaparan.

Secara khusus, model menggunakan algoritma pengelompokan K-Means untuk mencipta satu set zarah pemacu pada masa t=0, di mana setiap zarah pemacu diwakili oleh satu set atribut fizikal, termasuk kedudukan, halaju, kecerunan ubah bentuk dan medan halaju tempatan Kecerunan, modulus muda, jisim, nisbah dan isipadu Poisson.

Teras keras untuk menyelesaikan pepijat fizik Sora! Empat universiti terkemuka di Amerika Syarikat dikeluarkan bersama: Pasang enjin fizik untuk penjana video

Kedudukan awal zarah pemacu ialah purata kedudukan semua ahli kelompoknya, di mana bilangan zarah pemacu adalah jauh lebih kecil daripada bilangan zarah Gaussian tiga dimensi.

Semasa proses pemaparan, kedudukan dan putaran setiap zarah Gaussian tiga dimensi dikira dengan menginterpolasi kedudukan dan putaran zarah pemacu: untuk setiap zarah Gaussian tiga dimensi, mula-mula cari lapan zarah pemacu jiran terdekatnya pada masa t =0, Transformasi badan tegar T antara lapan zarah pemacu ini pada t=0 dan cap masa semasa kemudiannya dipasang untuk menentukan kedudukan semasa dan putaran zarah.

Hasil eksperimen

Dataset

Dengan merakam imej berbilang paparan, penyelidik mengumpul lapan adegan statik dunia sebenar, di mana setiap adegan termasuk objek dan satu pemandangan (sekuntum mawar merah, sekuntum bunga, sekuntum bunga mawar oren, sekuntum bunga tulip dan sekuntum bunga mawar putih), sekuntum bunga mawar, seutas tali telefon dan sebatang beanie kemudian menangkap empat video interaktif untuk Menerangkan pergerakan semula jadinya selepas interaksi, seperti mencucuk atau menyeret; , dan gunakan video sebenar sebagai rujukan tambahan untuk perbandingan.

Hasil eksperimen

Teras keras untuk menyelesaikan pepijat fizik Sora! Empat universiti terkemuka di Amerika Syarikat dikeluarkan bersama: Pasang enjin fizik untuk penjana video

Hasil analisis kualitatif pada modulus Young yang berbeza-beza secara spatial (kuantiti fizik yang mengukur keanjalan bahan)

pengguna sebenar dengan kaedah perbandingan membandingkan video yang dirakam dunia, dapat dilihat bahawa lebih daripada 80% peserta memilih model PhysDreamer dalam eksperimen dua pilihan (2AFC), mempercayai bahawa ia lebih unggul dalam keaslian gerakan dari segi kualiti visual; terdapat juga 65% daripada peserta PhysDreamer yang lebih disukai

Perlu diingat bahawa memandangkan adegan statik yang dibandingkan itu sendiri adalah konsisten, penilaian kualiti visual juga bergantung pada kesan gerakan objek yang dihasilkan pada tahap tertentu.

Teras keras untuk menyelesaikan pepijat fizik Sora! Empat universiti terkemuka di Amerika Syarikat dikeluarkan bersama: Pasang enjin fizik untuk penjana video

Ia boleh diperhatikan daripada kepingan corak gerakan pada titik masa yang berbeza bahawa PhysGaussian tidak mempunyai anggaran prinsip sifat bahan, menyebabkan amplitud gerakan yang dihasilkannya terlalu besar dan terlalu perlahan, yang tidak konsisten dengan realiti .

Berbanding dengan DreamGaussian4D, 70% dan 63.5% daripada sampel 2AFC lebih suka model PhysDreamer dari segi kualiti visual dan keaslian gerakan Seperti yang dapat dilihat dari gambar di atas, gerakan yang dihasilkan oleh DreamGaussian4D adalah berkala disimpan pada nilai malar yang kecil Sebaliknya, PhysDreamer boleh mensimulasikan kesan pengecilan dalam gerakan.

🎜

Atas ialah kandungan terperinci Teras keras untuk menyelesaikan pepijat fizik Sora! Empat universiti terkemuka di Amerika Syarikat dikeluarkan bersama: Pasang enjin fizik untuk penjana video. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan

Artikel ini dikembalikan pada:51CTO.COM. Jika ada pelanggaran, sila hubungi admin@php.cn Padam

Artikel Berkaitan

Membaca Indeks AI 2025: Adakah AI rakan, musuh, atau juruterbang bersama?Apr 11, 2025 pm 12:13 PM

Laporan Indeks Perisikan Buatan 2025 yang dikeluarkan oleh Stanford University Institute for Manusia Berorientasikan Kecerdasan Buatan memberikan gambaran yang baik tentang revolusi kecerdasan buatan yang berterusan. Mari kita menafsirkannya dalam empat konsep mudah: kognisi (memahami apa yang sedang berlaku), penghargaan (melihat faedah), penerimaan (cabaran muka), dan tanggungjawab (cari tanggungjawab kita). Kognisi: Kecerdasan buatan di mana -mana dan berkembang pesat Kita perlu menyedari betapa cepatnya kecerdasan buatan sedang berkembang dan menyebarkan. Sistem kecerdasan buatan sentiasa bertambah baik, mencapai hasil yang sangat baik dalam ujian matematik dan pemikiran kompleks, dan hanya setahun yang lalu mereka gagal dalam ujian ini. Bayangkan AI menyelesaikan masalah pengekodan kompleks atau masalah saintifik peringkat siswazah-sejak tahun 2023

Bermula dengan Meta Llama 3.2 - Analytics VidhyaApr 11, 2025 pm 12:04 PM

Meta's Llama 3.2: Lompat ke hadapan dalam Multimodal dan Mobile AI META baru -baru ini melancarkan Llama 3.2, kemajuan yang ketara dalam AI yang memaparkan keupayaan penglihatan yang kuat dan model teks ringan yang dioptimumkan untuk peranti mudah alih. Membina kejayaan o

AV Bytes: Meta ' s llama 3.2, Google's Gemini 1.5, dan banyak lagiApr 11, 2025 pm 12:01 PM

Landskap AI minggu ini: Badai kemajuan, pertimbangan etika, dan perdebatan pengawalseliaan. Pemain utama seperti Openai, Google, Meta, dan Microsoft telah melepaskan kemas kini, dari model baru yang terobosan ke peralihan penting di LE

Kos manusia bercakap dengan mesin: Bolehkah chatbot benar -benar peduli?Apr 11, 2025 pm 12:00 PM

Ilusi yang menghiburkan sambungan: Adakah kita benar -benar berkembang dalam hubungan kita dengan AI? Soalan ini mencabar nada optimis Simposium MIT Media Lab "yang memajukan AI (AHA)". Manakala acara itu mempamerkan cutting-EDG

Memahami Perpustakaan Scipy di PythonApr 11, 2025 am 11:57 AM

Pengenalan Bayangkan anda seorang saintis atau jurutera menangani masalah kompleks - persamaan pembezaan, cabaran pengoptimuman, atau analisis Fourier. Kemudahan penggunaan dan kemampuan grafik Python menarik, tetapi tugas -tugas ini menuntut alat yang berkuasa

3 Kaedah untuk menjalankan Llama 3.2 - Analytics VidhyaApr 11, 2025 am 11:56 AM

Meta's Llama 3.2: Powerhouse AI Multimodal Model multimodal terbaru Meta, Llama 3.2, mewakili kemajuan yang ketara dalam AI, yang membanggakan pemahaman bahasa yang dipertingkatkan, ketepatan yang lebih baik, dan keupayaan penjanaan teks yang unggul. Keupayaannya t

Mengotomatisasi Pemeriksaan Kualiti Data dengan DagsterApr 11, 2025 am 11:44 AM

Jaminan Kualiti Data: Pemeriksaan Automatik dengan Dagster dan Harapan Hebat Mengekalkan kualiti data yang tinggi adalah penting untuk perniagaan yang didorong data. Apabila jumlah data dan sumber meningkat, kawalan kualiti manual menjadi tidak cekap dan terdedah kepada kesilapan.

Adakah kerangka utama mempunyai peranan dalam era AI?Apr 11, 2025 am 11:42 AM

Main Frames: Wira Unsung Revolusi AI Walaupun pelayan cemerlang dalam aplikasi tujuan umum dan mengendalikan pelbagai pelanggan, kerangka utama dibina untuk tugas tinggi, misi kritikal. Sistem yang kuat ini sering dijumpai di Heavil

See all articles

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

Menjana ai hentai secara percuma.

Tunjukkan Lagi

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)

3 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Tetapan grafik terbaik

3 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Penyelesaian Riddle Seashell

2 minggu yang laluByDDD

R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa

3 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌

WWE 2K25: Cara Membuka Segala -galanya Di Myrise

3 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌

Tunjukkan Lagi

Alat panas

EditPlus versi Cina retak

Saiz kecil, penyerlahan sintaks, tidak menyokong fungsi gesaan kod

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SecLists

SecLists ialah rakan penguji keselamatan muktamad. Ia ialah koleksi pelbagai jenis senarai yang kerap digunakan semasa penilaian keselamatan, semuanya di satu tempat. SecLists membantu menjadikan ujian keselamatan lebih cekap dan produktif dengan menyediakan semua senarai yang mungkin diperlukan oleh penguji keselamatan dengan mudah. Jenis senarai termasuk nama pengguna, kata laluan, URL, muatan kabur, corak data sensitif, cangkerang web dan banyak lagi. Penguji hanya boleh menarik repositori ini ke mesin ujian baharu dan dia akan mempunyai akses kepada setiap jenis senarai yang dia perlukan.

MinGW - GNU Minimalis untuk Windows

Projek ini dalam proses untuk dipindahkan ke osdn.net/projects/mingw, anda boleh terus mengikuti kami di sana. MinGW: Port Windows asli bagi GNU Compiler Collection (GCC), perpustakaan import yang boleh diedarkan secara bebas dan fail pengepala untuk membina aplikasi Windows asli termasuk sambungan kepada masa jalan MSVC untuk menyokong fungsi C99. Semua perisian MinGW boleh dijalankan pada platform Windows 64-bit.

ZendStudio 13.5.1 Mac

Persekitaran pembangunan bersepadu PHP yang berkuasa

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

7467

Tutorial CakePHP

1376

Apakah format nama akaun stim

kunci pengaktifan win11 kekal

Sambungan NYT menunjukkan dan jawapan

Tunjukkan Lagi