Rumah >Peranti teknologi >AI >Pembalikan berterusan! DeepMind dipersoalkan oleh pasukan Rusia: Bagaimanakah kita dapat membuktikan bahawa rangkaian saraf memahami dunia fizikal?
Terdapat satu lagi kontroversi dalam komuniti saintifik baru-baru ini Protagonis cerita itu ialah kertas Sains yang diterbitkan oleh pusat penyelidikan DeepMind di London pada Disember 2021. Penyelidik mendapati bahawa rangkaian saraf boleh digunakan untuk melatih dan membina model. yang lebih baik daripada sebelumnya. Ketumpatan elektron dan peta interaksi yang lebih tepat boleh menyelesaikan ralat sistematik dalam teori fungsi tradisional.
Pautan kertas: https://www.science.org/doi/epdf/10.1126/science.abj6511
Model DM21 yang dicadangkan dalam artikel secara tepat mensimulasikan sistem kompleks seperti rantai hidrogen, pasangan asas DNA bercas dan keadaan peralihan binari. Bagi bidang kimia kuantum, ia boleh dikatakan telah membuka laluan teknikal yang boleh dilaksanakan kepada fungsi universal yang tepat.
Penyelidik DeepMind turut mengeluarkan kod model DM21 untuk memudahkan pembiakan oleh rakan sebaya.
Pautan repositori: https://github.com/deepmind/deepmind-research
Secara logiknya, kertas dan kod itu terbuka kepada orang ramai dan diterbitkan dalam jurnal teratas Hasil eksperimen dan kesimpulan penyelidikanpada dasarnya boleh dipercayai.
Tetapi lapan bulan kemudian, lapan penyelidik dari Rusia dan Korea Selatan turut menerbitkan ulasan saintifik dalam Sains Mereka percaya bahawa terdapat masalah dalam penyelidikan asal DeepMind, iaitu Set latihan dan set ujian mungkin bertindih, membawa kepada kesimpulan percubaan yang salah.
Pautan kertas: https://www.science.org/doi/epdf/10.1126/science.abq3385
Jika syak wasangka itu benar, maka kertas DeepMind, yang dikenali sebagai penerobosan teknologi utama dalam industri kimia, dan peningkatan rangkaian saraf mungkin dikaitkan dengan kebocoran data.
Walau bagaimanapun, DeepMind bertindak balas dengan cepat pada hari yang sama ulasan itu diterbitkan, ia segera menulis balasan untuk menyatakan tentangan dan kutukan yang kuat: pandangan yang mereka bangkitkan sama ada tidak betul tidak relevan dengan kesimpulan utama kertas kerja dan penilaian kualiti keseluruhan DM21.
Pautan kertas: https://www.science.org/doi/epdf/10.1126/science.abq4282
Ahli fizik terkenal Feynman pernah berkata, Para saintis mesti membuktikan diri mereka salah secepat mungkin.
Walaupun hasil perbincangan ini belum dimuktamadkan dan pasukan Rusia belum menerbitkan artikel sanggahan lanjut, insiden itu mungkin memberi kesan yang lebih mendalam terhadap penyelidikan dalam bidang kecerdasan buatan : Iaitu, Bagaimana untuk membuktikan bahawa model rangkaian saraf yang anda telah latih benar-benar memahami tugas, dan bukannya hanya menghafal corak?
Soalan KajianKimia ialah sains pusat abad ke-21 (yakin), seperti mereka bentuk bahan baharu dengan sifat tertentu, seperti menghasilkan tenaga elektrik yang bersih atau membangunkan Superkonduktor suhu tinggi semuanya memerlukan simulasi elektron pada komputer.
Elektron ialah zarah subatom yang mengawal cara atom bergabung untuk membentuk molekul. Mereka juga bertanggungjawab terhadap pengaliran elektrik dalam pepejal ke arah menerangkan struktur dan sifat dan kereaktifannya.
Pada tahun 1926, Schrödinger mencadangkan persamaan Schrödinger, yang boleh menerangkan dengan betul kelakuan kuantum fungsi gelombang. Tetapi menggunakan persamaan ini untuk meramalkan elektron dalam molekul adalah tidak mencukupi kerana semua elektron menolak satu sama lain, dan adalah perlu untuk mengesan kebarangkalian kedudukan setiap elektron, yang merupakan tugas yang sangat rumit walaupun untuk sebilangan kecil elektron.
Satu kejayaan besar berlaku pada tahun 1960-an, apabila Pierre Hohenberg dan Walter Kohn menyedari tidak perlu menjejaki setiap elektron secara individu. Sebaliknya, mengetahui kebarangkalian mana-mana elektron berada dalam setiap kedudukan (iaitu, ketumpatan elektron) sudah cukup untuk mengira dengan tepat semua interaksi.
Setelah membuktikan teori di atas, Kohn memenangi Hadiah Nobel dalam Kimia, lantas mencipta teori fungsi ketumpatan (teori fungsi ketumpatan, DFT)
Walaupun DFT membuktikan bahawa pemetaan wujud, selama lebih daripada 50 tahun sifat sebenar pemetaan antara ketumpatan elektron dan tenaga interaksi, yang dipanggil fungsi ketumpatan, kekal tidak diketahui dan mesti diselesaikan lebih kurang.
DFT pada asasnya ialah kaedah untuk menyelesaikan persamaan Schrödinger, dan ketepatannya bergantung pada bahagian korelasi pertukarannya. Walaupun DFT melibatkan tahap penghampiran tertentu, ia adalah satu-satunya cara praktikal untuk mengkaji bagaimana dan mengapa jirim berkelakuan dengan cara tertentu pada tahap mikroskopik, dan oleh itu telah menjadi salah satu teknik yang paling banyak digunakan dalam semua bidang sains.
Selama bertahun-tahun, penyelidik telah mencadangkan lebih daripada 400 fungsi anggaran dengan tahap ketepatan yang berbeza-beza, tetapi semua anggaran ini mengalami ralat sistematik kerana ia gagal menangkap beberapa matematik utama bagi ciri fungsi yang tepat.
Apabila ia datang untuk mempelajari fungsi anggaran, bukankah ini yang dilakukan oleh rangkaian saraf?
Dalam kertas kerja ini, DeepMind melatih rangkaian saraf DM 21 pada data molekul dan sistem rekaan dengan caj pecahan dan putaran (DeepMind 21), dengan jayanya mempelajari fungsi tanpa ralat sistematik, yang boleh mengelakkan ralat penyahtempatan dan pecah simetri putaran, dan boleh menerangkan dengan lebih baik pelbagai kategori tindak balas kimia.
Pada dasarnya, sebarang proses kimia dan fizikal yang melibatkan pergerakan cas terdedah kepada ralat penyahtempatan, dan sebarang proses yang melibatkan pemecahan ikatan terdedah kepada Putaran simetri rosak. Walaupun pergerakan cas dan pemecahan ikatan adalah di tengah-tengah banyak aplikasi teknikal yang penting, masalah ini juga boleh menyebabkan banyak kegagalan kualitatif dalam menerangkan kumpulan berfungsi molekul paling ringkas, seperti hidrogen.
Model ini dibina menggunakan perceptron berbilang lapisan (MLP), dan input ialah bahagian tempatan dan bukan tempatan bagi Kohn yang diduduki -Sham (KS) orbit ciri-ciri tempatan.
Fungsi objektif mengandungi dua: satu ialah kehilangan regresi yang digunakan untuk mempelajari tenaga korelasi pertukaran itu sendiri, dan satu lagi adalah untuk memastikan bahawa derivatif fungsi boleh digunakan dalam konsisten diri medan selepas latihan , SCF) dikira jangka penaturan kecerunan.
Untuk kehilangan regresi, penyelidik menggunakan set data ketumpatan tetap yang mewakili reaktan dan produk 2235 tindak balas, dan melatih rangkaian untuk memetakan daripada ketumpatan ini kepada tenaga tindak balas yang Sangat tepat, dengan 1161 tindak balas latihan yang mewakili pengabusan, pengionan, pertalian elektron dan tenaga pengikat antara molekul molekul H-Kr kumpulan utama kecil, dan 1074 tindak balas yang mewakili ketumpatan FC dan FS utama atom H-Ar .
Model DM21 yang terhasil berjalan secara konsisten pada semua tindak balas penanda aras keluarga utama yang besar, menghasilkan ketumpatan molekul yang lebih tepat.
Apabila DeepMind melatih DM21, data yang digunakan ialah sistem cas pecahan, seperti atom hidrogen dengan separuh elektron.
Untuk membuktikan keunggulan DM21, para penyelidik mengujinya pada satu set dimer yang diregangkan, yang dipanggil set penanda aras pemecah ikatan (BBB). Contohnya, dua atom hidrogen yang berjauhan mempunyai jumlah satu elektron.
Hasil eksperimen mendapati bahawa fungsi DM21 menunjukkan prestasi cemerlang pada set ujian BBB, mengatasi semua fungsi DFT klasik yang diuji setakat ini dan DM21m (sama seperti latihan DM21, tetapi pada Tiada caj pecahan dalam set latihan).
Kemudian DeepMind mendakwa dalam kertas itu: DM21 telah memahami prinsip fizikal di sebalik sistem caj pecahan.
Tetapi jika anda melihat dengan teliti, anda akan mendapati bahawa dalam kumpulan BBB, semua dimer menjadi sangat serupa dengan sistem dalam kumpulan latihan. Malah, disebabkan sifat setempat interaksi elektrolemah, interaksi atom hanya kuat dalam jarak yang dekat, di luar kedua-dua atom berkelakuan pada dasarnya seolah-olah mereka tidak berinteraksi.
Michael Medvedev, ketua kumpulan penyelidik di Zelinsky Institute of Organic Chemistry of the Russian Academy of Sciences, menerangkan bahawa dalam beberapa cara rangkaian saraf adalah seperti manusia Begitu juga, mereka lebih suka mendapat jawapan yang betul atas sebab yang salah. Jadi tidak sukar untuk melatih rangkaian saraf, tetapi sukar untuk membuktikan bahawa ia telah mempelajari undang-undang fizik daripada hanya menghafal jawapan yang betul.
Oleh itu, set ujian BBB bukanlah set ujian yang sesuai: ia tidak menguji pemahaman DM21 tentang sistem elektronik pecahan, analisis menyeluruh terhadap empat bukti lain pemprosesan DM21 sistem sedemikian Tiada kesimpulan konklusif boleh dibuat sama ada: hanya ketepatan yang baik pada set SIE4x4 mungkin boleh dipercayai.
Penyelidik Rusia juga percaya bahawa penggunaan sistem caj pecahan dalam set latihan bukanlah satu-satunya perkara baharu dalam kerja DeepMind. Idea mereka untuk memperkenalkan kekangan fizikal ke dalam rangkaian saraf melalui set latihan, dan kaedah memberi makna fizikal melalui latihan potensi kimia yang betul, boleh digunakan secara meluas dalam pembinaan fungsi DFT rangkaian saraf pada masa hadapan.
Berkenaan dakwaan kertas Komen bahawa keupayaan DM21 untuk meramalkan keadaan caj pecahan (FC) dan putaran pecahan (FS) di luar set latihan tidak berada dalam kertas Ini ditunjukkan berdasarkan lebih kurang 50% pertindihan set latihan dengan penanda aras pemecah ikatan BBB, serta keberkesanan dan ketepatan contoh generalisasi lain.
DeepMind tidak bersetuju dengan analisis ini dan percaya bahawa pandangan yang dibangkitkan adalah sama ada tidak betul atau tidak berkaitan dengan kesimpulan utama kertas kerja dan penilaian kualiti keseluruhan DM21, kerana BBB tidak berada dalam kertas Hanya contoh tingkah laku FC dan FS ditunjukkan.
Pertindihan antara set latihan dan set ujian ialah isu penyelidikan yang patut diberi perhatian dalam pembelajaran mesin: ingatan bermakna model boleh dilatih dengan menyalin Contoh tertumpu berprestasi lebih baik pada set ujian.
Gerasimov percaya bahawa prestasi DM21 pada BBB (mengandungi dimer pada jarak terhingga) boleh dicapai dengan mereplikasi keluaran sistem FC dan FS (iaitu atom pada had pemisahan tak terhingga dengan dimer perlawanan) dijelaskan dengan baik.
Untuk menunjukkan bahawa DM21 melangkaui set latihan, penyelidik DeepMind juga mempertimbangkan H2+ (dimer kationik) dan H2 (dimer neutral Untuk contoh BBB prototaip daripada agregat), dapat disimpulkan bahawa fungsi korelasi pertukaran yang tepat adalah bukan setempat; pengembalian nilai hafalan yang berterusan boleh membawa kepada ralat ketara dalam ramalan BBB apabila jarak meningkat.
Atas ialah kandungan terperinci Pembalikan berterusan! DeepMind dipersoalkan oleh pasukan Rusia: Bagaimanakah kita dapat membuktikan bahawa rangkaian saraf memahami dunia fizikal?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!