Rumah  >  Artikel  >  Peranti teknologi  >  Rangkaian saraf juga mempunyai kesedaran spatial! Belajar membuat peta dalam Minecraft, diterbitkan dalam sub-majalah Nature

Rangkaian saraf juga mempunyai kesedaran spatial! Belajar membuat peta dalam Minecraft, diterbitkan dalam sub-majalah Nature

王林
王林asal
2024-07-24 09:38:12537semak imbas

Ini adalah kali pertama manusia menunjukkan bahawa rangkaian saraf boleh mencipta peta mereka sendiri. Bayangkan anda berada di bandar yang pelik Walaupun pada mulanya persekitaran di sekeliling anda tidak dikenali, anda boleh menerokai sekeliling dan akhirnya melukis peta persekitaran dalam otak anda, yang merangkumi bangunan, jalan, papan tanda, dll. yang berinteraksi antara satu sama lain. hubungan kedudukan antara mereka. Keupayaan untuk membina peta spatial dalam otak ini mendasari jenis kognisi peringkat tinggi pada manusia: contohnya, bahasa berteori untuk dikodkan oleh struktur seperti peta dalam otak. Walau bagaimanapun, walaupun kecerdasan buatan dan rangkaian saraf yang paling canggih tidak dapat membina peta sedemikian daripada udara nipis. Matt Thomson, penolong profesor biologi pengiraan dan penyelidik di Institut Penyelidikan Perubatan Warisan, berkata: "Terdapat perasaan bahawa walaupun model kecerdasan buatan yang paling canggih tidak benar-benar pintar. Mereka tidak dapat menyelesaikan masalah seperti kita; mereka tidak dapat membuktikan keputusan Matematik yang tidak terbukti. juga gagal menjana idea baharu. "Kami fikir ini kerana mereka tidak boleh menavigasi dalam ruang konsep; menyelesaikan masalah yang kompleks adalah seperti bergerak dalam ruang konsep, seperti navigasi. AI lebih seperti pembelajaran hafalan. Kembali - anda memberi input dan ia memberi anda jawapan, tetapi ia tidak dapat mensintesis idea yang berbeza." Baru-baru ini, kertas baru dari Makmal Thomson mendapati bahawa rangkaian saraf boleh menggunakan algoritma yang dipanggil "pengekodan ramalan". Bina peta spatial. Kertas itu diterbitkan dalam jurnal Nature Machine Intelligence pada 18 Julai.

Rangkaian saraf juga mempunyai kesedaran spatial! Belajar membuat peta dalam Minecraft, diterbitkan dalam sub-majalah Nature

1. Alamat kertas: https://www.nature.com/articles/s42256-024-00863-1
  1. Alamat kod: https://github.com/jgornet/predictive-coding-recovers-maps

Pelajar siswazah James Gornet mengetuai pasukan untuk membina persekitaran di Minecraft, menggabungkan elemen kompleks (seperti pokok, sungai, gua). Mereka merakam video pemain secara rawak berjalan melalui kawasan itu dan menggunakan video untuk melatih rangkaian saraf yang dilengkapi dengan algoritma pengekodan ramalan.

Penyelidikan mendapati bahawa rangkaian saraf mempelajari cara objek dalam dunia Minecraft diatur dan boleh "meramal" persekitaran yang akan dihadapi oleh pemain apabila bergerak melalui angkasa.

Rangkaian saraf juga mempunyai kesedaran spatial! Belajar membuat peta dalam Minecraft, diterbitkan dalam sub-majalah Nature

Gabungan algoritma pengekodan ramalan dan permainan Minecraft berjaya "mengajar" rangkaian saraf cara membuat peta spatial dan kemudian menggunakan peta spatial ini untuk meramalkan bingkai video berikutnya Akibatnya, ralat kuasa dua min antara imej ramalan dan imej akhir hanya 0.094%.

Lebih penting lagi, pasukan penyelidik "membuka" rangkaian saraf (bersamaan dengan memeriksa struktur dalaman) dan mendapati bahawa perwakilan pelbagai objek disimpan secara spatial secara relatif antara satu sama lain. Dengan kata lain, mereka melihat peta persekitaran Minecraft yang disimpan dalam rangkaian saraf.

Rangkaian saraf boleh menavigasi peta yang diberikan kepada mereka oleh pereka manusia, seperti kereta pandu sendiri menggunakan GPS, tetapi ini adalah kali pertama manusia menunjukkan bahawa rangkaian saraf boleh mencipta peta mereka sendiri. Keupayaan untuk menyimpan dan menyusun maklumat secara spatial ini akhirnya akan membantu rangkaian saraf menjadi lebih "pintar", membolehkan mereka menyelesaikan masalah yang benar-benar kompleks seperti manusia.

Projek ini menunjukkan keupayaan kesedaran spatial sebenar AI, yang masih tidak dilihat dalam teknologi seperti Sora OpenAI, yang mempunyai beberapa gangguan pelik.

James Gornet ialah pelajar di Jabatan Sistem Pengiraan dan Neural (CNS) di Caltech, yang merangkumi sains saraf, pembelajaran mesin, matematik, statistik dan biologi.

"Program CNS benar-benar menyediakan tempat untuk James melakukan kerja unik yang tidak mungkin dilakukan di tempat lain," kata Thomson. "Kami mengambil pendekatan pembelajaran mesin yang diilhamkan secara biologi yang membolehkan kami merekayasa balik sifat-sifat otak dalam rangkaian saraf tiruan, dan kami berharap dapat memahami otak secara bergilir-gilir Di Caltech, kami mempunyai pasukan yang sangat menerima jenis ini kerja. 》

Rangkaian Neural yang Melakukan Pengekodan Ramalan

Diilhamkan oleh perwakilan ruang tersirat dalam masalah inferens pengekodan ramalan, para penyelidik membangunkan pelaksanaan pengiraan ejen pengekodan ramalan dan mengkaji tingkah laku ejen semasa meneroka persekitaran maya. Perwakilan spatial yang dipelajari.

Mereka bermula dengan mencipta persekitaran menggunakan persekitaran Malmo di Minecraft. Persekitaran fizikal mempunyai dimensi 40 × 65 jubin dan merangkumi tiga aspek pemandangan visual: gua menyediakan mercu tanda visual global, hutan membolehkan persamaan antara pemandangan visual dan sungai dengan jambatan mengehadkan pemandangan visual persekitaran (Rajah 1a).

Rangkaian saraf juga mempunyai kesedaran spatial! Belajar membuat peta dalam Minecraft, diterbitkan dalam sub-majalah Nature

1 Ejen mengikut laluan yang ditentukan oleh carian A* untuk mencari laluan terpendek antara lokasi sampel rawak dan menerima imej visual pada setiap laluan.
  1. Untuk melaksanakan pengekodan ramalan, pengarang membina rangkaian neural konvolusi penyahkod pengekod, pengekod menggunakan seni bina ResNet-18, dan penyahkod menggunakan seni bina ResNet-18 konvolusi alih alih (Rajah 1b). Seni bina penyahkod pengekod menggunakan seni bina U-Net untuk menghantar unit terpendam yang dikodkan ke dalam penyahkod.
  2. Proses perhatian berbilang kepala mengekod jujukan unit terpendam untuk mengekod sejarah pemerhatian visual yang lalu. Perhatian berbilang kepala mempunyai h = 8 kepala. Untuk unit terpendam pengekodan dimensi D = C × H × W, dengan ketinggian H, lebar W dan saluran C, dimensi kepala tunggal ialah d = C × H × W/j.

    Rangkaian saraf juga mempunyai kesedaran spatial! Belajar membuat peta dalam Minecraft, diterbitkan dalam sub-majalah Nature

    Pengekod ramalan menggunakan strategi pengecilan ralat kuasa dua min untuk menyesuaikan perbezaan antara nilai cerapan yang diramalkan dan nilai cerapan sebenar.

Butiran latihan:

  • Bilangan sampel: 82,630
  • Evolusi: 200
  • Pengoptimum: Keturunan Kecerunan Momentum Nesterov
  • Kadar 5 ×
  • :(Pembelajaran awal 5 ×
  • ) 10^( - 1)
  • Penjadualan kadar pembelajaran: Selepas latihan OneCycle

, pengekod ramalan mencapai kesetiaan visual yang baik, dan ralat kuasa dua min antara imej yang diramalkan dan imej sebenar ialah 0.094 (ditunjukkan dalam Rajah 1c).

Rangkaian saraf juga mempunyai kesedaran spatial! Belajar membuat peta dalam Minecraft, diterbitkan dalam sub-majalah Nature

Sila lihat kertas asal untuk butiran lanjut.

Pautan rujukan:

https://techxplore.com/news/2024-07-neural-network-minecraft.html

https://www.tomshardware.com/tech-industry/artificial-intelligence/neural- rangkaian-belajar-untuk-membuat-peta-dengan-kod-minecraft-tersedia-di-github

Atas ialah kandungan terperinci Rangkaian saraf juga mempunyai kesedaran spatial! Belajar membuat peta dalam Minecraft, diterbitkan dalam sub-majalah Nature. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn