Belajar seperti bayi, model baharu DeepMind mempelajari peraturan dunia fizikal dalam masa 28 jam-AI-php.cn

Rumah

Peranti teknologi

Belajar seperti bayi, model baharu DeepMind mempelajari peraturan dunia fizikal dalam masa 28 jam

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 09, 2023 am 11:41 AM

aideepmindalphafold

Deepmind bertujuan untuk membina model yang boleh mempelajari fizik intuitif dan menganalisis sebab model itu mencapai keupayaan ini.

Dari AlphaFold kepada penaakulan matematik, DeepMind telah cuba menggabungkan AI dan sains asas. Kini, DeepMind telah mencipta model baharu yang boleh mempelajari peraturan fizikal mudah.

Pakar psikologi perkembangan menguji dan menganalisis cara bayi mengikuti pergerakan objek melalui pandangan mereka. Sebagai contoh, kanak-kanak melahirkan rasa terkejut apabila video dimainkan di mana bola tiba-tiba hilang.

Luis Piloto, seorang saintis komputer di DeepMind, dan rakan sekerja berharap dapat membangunkan ujian serupa untuk kecerdasan buatan (AI). Pasukan itu melatih rangkaian saraf menggunakan video animasi objek mudah seperti kiub dan bola, dan model itu belajar dengan menemui corak dalam jumlah data yang besar. Kertas penyelidikan itu diterbitkan pada 11 Julai dalam Nature Human Behavior.

Belajar seperti bayi, model baharu DeepMind mempelajari peraturan dunia fizikal dalam masa 28 jam

Alamat kertas: https://www.nature.com/articles/s41562-022-01394 -8
Alamat set data: https://github.com/deepmind/physical_concepts

Model ini melaksanakan pembelajaran fizikal dengan mengekod dan menjejak objek secara automatik, Oleh itu nama PLATO (Pembelajaran Fizik melalui Pengekodan Auto dan Objek Penjejakan). PLATO menerima imej asal daripada video dan versi imej yang menyerlahkan sasaran setiap objek dalam adegan. PLATO bertujuan untuk membangunkan perwakilan dalaman sifat fizikal objek, seperti kedudukan dan halajunya.

Sistem ini telah dilatih pada kira-kira 30 jam video yang menunjukkan mekanisme gerakan mudah (seperti bola bergolek menuruni cerun) dan membangunkan keupayaan untuk meramalkan kelakuan objek ini dalam situasi yang berbeza . Khususnya, PLATO mempelajari kesinambungan dan keteguhan untuk memastikan trajektori sasaran tidak terganggu dan bentuk objek adalah berterusan. Apabila video dimainkan, ramalan model menjadi lebih tepat.

Apabila memainkan video dengan peristiwa "mustahil", seperti objek yang tiba-tiba hilang, PLATO boleh mengukur perbezaan antara video dan ramalannya sendiri, sekali gus memberikan ukuran "kejutan".

Piloto berkata: "PLATO tidak direka sebagai model tingkah laku bayi, tetapi ia boleh menguji hipotesis tentang cara bayi manusia belajar. Kami berharap saintis kognitif akhirnya akan menggunakannya untuk mensimulasikan tingkah laku bayi."

Jeff Clune, seorang saintis komputer di University of British Columbia, berkata, "Membandingkan AI dengan kaedah pembelajaran bayi manusia ialah hala tuju penyelidikan yang penting. Penyelidik PLATO mereka bentuk tangan banyak pengetahuan sedia ada yang memberikan model kecerdasan buatan kelebihan." Penyelidik seperti Clune cuba membenarkan program membangunkan algoritma mereka sendiri untuk memahami dunia fizikal.

Menggunakan pengetahuan daripada psikologi perkembangan

Untuk mengejar intuisi fizikal yang lebih kaya dalam sistem AI, pasukan penyelidik DeepMind mendapat inspirasi daripada psikologi perkembangan. Pasukan penyelidik membina sistem pembelajaran mendalam yang menggabungkan pandangan teras daripada psikologi perkembangan, iaitu fizik difahami pada tahap objek diskret dan interaksinya.

Teras fizik intuitif bergantung pada set konsep diskret (cth., kegigihan objek, kepejalan, kesinambungan, dll.) yang boleh dibezakan, dimanipulasi dan dikesan secara individu. Pendekatan tradisional dan standard untuk pembelajaran AI fizik intuitif belajar tentang dunia fizikal melalui video atau peramal keadaan, ramalan hasil binari, prestasi soalan-jawapan atau tugasan pembelajaran pengukuhan. Pendekatan ini nampaknya memerlukan pemahaman beberapa aspek fizik intuitif tetapi tidak beroperasi secara eksplisit atau meneroka set konsep yang jelas secara strategik.

Psikologi perkembangan, sebaliknya, berpendapat bahawa konsep fizikal sepadan dengan satu set jangkaan tentang bagaimana masa depan akan berlaku. Sebagai contoh, orang menjangkakan bahawa objek tidak akan secara ajaib teleport dari satu tempat ke tempat lain secara tiba-tiba, tetapi akan mengesan laluan berterusan melalui masa dan ruang, yang membawa kepada konsep kesinambungan. Oleh itu, terdapat satu cara untuk mengukur pengetahuan tentang konsep fizikal tertentu: paradigma Pelanggaran Jangkaan (VoE).

Apabila meneroka konsep tertentu menggunakan paradigma VoE, penyelidik menunjukkan tatasusunan visual yang serupa (dipanggil probe) pada bayi yang sama ada konsisten (mungkin secara fizikal) atau tidak konsisten (tidak mungkin secara fizikal) dengan konsep fizikal yang mungkin. Dalam paradigma ini, "kejutan" diukur dengan tempoh pandangan.

Belajar seperti bayi, model baharu DeepMind mempelajari peraturan dunia fizikal dalam masa 28 jam

Pengenalan kaedah

Pertama, DeepMind mencadangkan korpus video yang sangat kaya - set data Konsep Fizikal. Set data ini mengandungi video siasatan VoE yang menyasarkan lima konsep fizikal penting yang dianggap sebagai elemen teras dalam psikologi perkembangan, termasuk kesinambungan, kegigihan matlamat dan keteguhan. Keempat ialah kebolehubah, yang menangkap konsep bahawa sifat sasaran tertentu (seperti bentuk) tidak berubah; konsep kelima ialah inersia arah, yang melibatkan jangkaan bahawa objek yang bergerak akan berubah dalam arah yang konsisten dengan prinsip inersia.

Perkara yang paling penting ialah set data Konsep Fizikal juga termasuk korpus video yang berasingan sebagai data latihan. Video ini menunjukkan pelbagai acara fizik yang dihasilkan secara prosedur.

Belajar seperti bayi, model baharu DeepMind mempelajari peraturan dunia fizikal dalam masa 28 jam

Rajah 2: Contoh set data video yang digunakan untuk melatih model

Seni bina model PLATO

Deepmind bertujuan membina intuitif pembelajaran model fizik, dan menganalisis mengapa model mencapai keupayaan ini. Beberapa sistem lanjutan dalam bidang AI digunakan dalam model PLATO.

Pertama ialah proses pemperibadian sasaran. Proses pemperibadian sasaran memotong input deria penglihatan berterusan kepada satu set entiti diskret, yang setiap satunya mempunyai set atribut yang sepadan. Dalam PLATO, setiap bingkai video bersegmen diuraikan kepada satu set kod sasaran (Rajah 3a-c) oleh modul persepsi, membolehkan pemetaan daripada input visual kepada sasaran individu. PLATO tidak belajar membahagikan adegan, tetapi memandangkan sasaran pembahagian, ia mempelajari perwakilan termampat.

Kedua, penjejakan sasaran (atau indeks sasaran) memberikan indeks kepada setiap sasaran, dengan itu mencapai kesesuaian antara persepsi sasaran dan pengiraan atribut dinamik merentas masa (Rajah 3b, c). Dalam PLATO, kod sasaran terkumpul dan dijejaki pada bingkai dalam penimbal sasaran (Rajah 3d).

Komponen terakhir ialah pemprosesan perhubungan bagi sasaran yang dijejak ini Proses ini diilhamkan oleh "sistem penaakulan fizikal" yang dicadangkan dalam psikologi perkembangan, yang boleh memproses perhubungan antara objek secara dinamik , menjana perwakilan baharu yang dipengaruhi oleh hubungan dan interaksi antara objek dan objek lain.

PLATO mempelajari interaksi antara memori sasaran dan sejarah persepsi sasaran (Rajah 3d) untuk menjana bingkai video yang diramalkan untuk sasaran seterusnya dan mengemas kini memori berasaskan sasaran.

Belajar seperti bayi, model baharu DeepMind mempelajari peraturan dunia fizikal dalam masa 28 jam

Rajah 3: PLATO merangkumi dua komponen: modul persepsi (kiri) dan ramalan dinamik (kanan)

Hasil eksperimen

Dalam Bila diuji, PLATO menunjukkan kesan VoE yang kuat dalam semua lima kategori pengesanan apabila dilatih dengan lima benih rawak yang berbeza.

Belajar seperti bayi, model baharu DeepMind mempelajari peraturan dunia fizikal dalam masa 28 jam

Rajah 5: PLATO menunjukkan prestasi teguh dalam meneliti set data Konsep Fizikal.

Korpus latihan dalam set data Konsep Fizikal mengandungi sejumlah 300,000 video. Menggunakan pengiraan konservatif, kira-kira 52 hari pengalaman visual berterusan diperlukan. Dari perspektif AI dan pembangunan, terdapat persoalan tentang berapa banyak data latihan sebenarnya diperlukan untuk menghasilkan kesan VoE dalam ujian. Untuk menilai ini, Deepmind melatih benih rawak tiga peramal dinamik PLATO pada set data saiz yang semakin berkurangan (Rajah 6), mengira purata besar kesan VoE merentas kelima-lima kelas pengesanan.

Keputusan menunjukkan kesan VoE yang mantap dalam model Deepmind selepas latihan dengan sekurang-kurangnya 50,000 contoh (bersamaan dengan 28 jam pengalaman visual) .

Belajar seperti bayi, model baharu DeepMind mempelajari peraturan dunia fizikal dalam masa 28 jam

Rajah 6: PLATO menunjukkan hasil yang hebat dalam hanya 28 jam pengalaman visual.

Ujian generalisasi: Deepmind menggunakan set data ADEPT, yang direka bentuk untuk meneroka pengetahuan fizikal intuitif. Seperti yang ditunjukkan dalam Rajah 7, PLATO menunjukkan kesan VoE yang jelas untuk ketiga-tiga kategori pengesanan.

Belajar seperti bayi, model baharu DeepMind mempelajari peraturan dunia fizikal dalam masa 28 jam

Rajah 7: PLATO menunjukkan kesan teguh pada sasaran dan dinamik yang tidak kelihatan tanpa sebarang latihan semula.

Untuk maklumat lanjut, sila lihat kertas asal.

Atas ialah kandungan terperinci Belajar seperti bayi, model baharu DeepMind mempelajari peraturan dunia fizikal dalam masa 28 jam. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan

Artikel ini dikembalikan pada:51CTO.COM. Jika ada pelanggaran, sila hubungi admin@php.cn Padam

Artikel Berkaitan

Mutable vs objek yang tidak berubah di Python - Analytics VidhyaApr 13, 2025 am 09:15 AM

Pengenalan Python adalah bahasa pengaturcaraan berorientasikan objek (atau oops). Dalam artikel saya yang terdahulu, kami meneroka sifatnya yang serba boleh. Oleh kerana itu, Python menawarkan pelbagai jenis data, yang boleh diklasifikasikan secara meluas ke m

11 Saluran YouTube Untuk Belajar Tableau secara Percuma - Analytics VidhyaApr 13, 2025 am 09:14 AM

Pengenalan Tableau dianggap sebagai salah satu alat visualisasi data yang paling mantap yang sedang digunakan oleh syarikat dan individu di seluruh dunia untuk analisis dan pembentangan data yang cekap. Dengan antara muka mesra pengguna dan exten

10 Pelanjutan pengekodan AI generatif dalam kod vs yang mesti anda pelajariApr 13, 2025 am 01:14 AM

Hei ada, pengekodan ninja! Apa tugas yang berkaitan dengan pengekodan yang anda telah merancang untuk hari itu? Sebelum anda menyelam lebih jauh ke dalam blog ini, saya ingin anda memikirkan semua kesengsaraan yang berkaitan dengan pengekodan anda-lebih jauh menyenaraikan mereka. Selesai? - Let ’

Memasak Inovasi: Bagaimana Kecerdasan Buatan Mengubah Perkhidmatan MakananApr 12, 2025 pm 12:09 PM

AI Menambah Penyediaan Makanan Walaupun masih dalam penggunaan baru, sistem AI semakin digunakan dalam penyediaan makanan. Robot yang didorong oleh AI digunakan di dapur untuk mengautomasikan tugas penyediaan makanan, seperti membuang burger, membuat pizza, atau memasang SA

Panduan Komprehensif mengenai Python Namespaces & Variable ScopesApr 12, 2025 pm 12:00 PM

Pengenalan Memahami ruang nama, skop, dan tingkah laku pembolehubah dalam fungsi Python adalah penting untuk menulis dengan cekap dan mengelakkan kesilapan runtime atau pengecualian. Dalam artikel ini, kami akan menyelidiki pelbagai ASP

Panduan Komprehensif untuk Model Bahasa Visi (VLMS)Apr 12, 2025 am 11:58 AM

Pengenalan Bayangkan berjalan melalui galeri seni, dikelilingi oleh lukisan dan patung yang terang. Sekarang, bagaimana jika anda boleh bertanya setiap soalan dan mendapatkan jawapan yang bermakna? Anda mungkin bertanya, "Kisah apa yang anda ceritakan?

MediaTek meningkatkan barisan premium dengan Kompanio Ultra dan Dimensity 9400Apr 12, 2025 am 11:52 AM

Meneruskan irama produk, bulan ini MediaTek telah membuat satu siri pengumuman, termasuk Kompanio Ultra dan Dimensity 9400 yang baru. Produk ini mengisi bahagian perniagaan MediaTek yang lebih tradisional, termasuk cip untuk telefon pintar

Minggu ini di AI: Walmart menetapkan trend fesyen sebelum mereka pernah berlakuApr 12, 2025 am 11:51 AM

#1 Google melancarkan Agent2Agent Cerita: Ia Isnin pagi. Sebagai perekrut berkuasa AI, anda bekerja lebih pintar, tidak lebih sukar. Anda log masuk ke papan pemuka syarikat anda di telefon anda. Ia memberitahu anda tiga peranan kritikal telah diperolehi, dijadualkan, dan dijadualkan untuk

See all articles

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

Menjana ai hentai secara percuma.

Tunjukkan Lagi

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)

3 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Tetapan grafik terbaik

3 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Penyelesaian Riddle Seashell

2 minggu yang laluByDDD

R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa

3 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌

WWE 2K25: Cara Membuka Segala -galanya Di Myrise

4 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌

Tunjukkan Lagi

Alat panas

mPDF

mPDF ialah perpustakaan PHP yang boleh menjana fail PDF daripada HTML yang dikodkan UTF-8. Pengarang asal, Ian Back, menulis mPDF untuk mengeluarkan fail PDF "dengan cepat" dari tapak webnya dan mengendalikan bahasa yang berbeza. Ia lebih perlahan dan menghasilkan fail yang lebih besar apabila menggunakan fon Unicode daripada skrip asal seperti HTML2FPDF, tetapi menyokong gaya CSS dsb. dan mempunyai banyak peningkatan. Menyokong hampir semua bahasa, termasuk RTL (Arab dan Ibrani) dan CJK (Cina, Jepun dan Korea). Menyokong elemen peringkat blok bersarang (seperti P, DIV),

SecLists

SecLists ialah rakan penguji keselamatan muktamad. Ia ialah koleksi pelbagai jenis senarai yang kerap digunakan semasa penilaian keselamatan, semuanya di satu tempat. SecLists membantu menjadikan ujian keselamatan lebih cekap dan produktif dengan menyediakan semua senarai yang mungkin diperlukan oleh penguji keselamatan dengan mudah. Jenis senarai termasuk nama pengguna, kata laluan, URL, muatan kabur, corak data sensitif, cangkerang web dan banyak lagi. Penguji hanya boleh menarik repositori ini ke mesin ujian baharu dan dia akan mempunyai akses kepada setiap jenis senarai yang dia perlukan.