Rumah >Peranti teknologi >AI >'Saintis AI” baharu menggabungkan teori dan data untuk menemui persamaan saintifik

'Saintis AI” baharu menggabungkan teori dan data untuk menemui persamaan saintifik

PHPz
PHPzke hadapan
2023-05-18 10:49:05938semak imbas

Para saintis menyasarkan untuk menemui formula bermakna yang menerangkan data percubaan dengan tepat. Model matematik fenomena semula jadi boleh dibuat secara manual berdasarkan pengetahuan domain, atau ia boleh dibuat secara automatik daripada set data besar menggunakan algoritma pembelajaran mesin. Komuniti akademik telah mengkaji masalah penggabungan pengetahuan terdahulu yang berkaitan dan model fungsi yang berkaitan, dan percaya bahawa mencari model yang selaras dengan pengetahuan terdahulu mengenai aksiom logik am adalah masalah yang tidak dapat diselesaikan.

Penyelidik daripada pasukan penyelidik IBM dan pasukan AI Samsung membangunkan kaedah "AI-Descartes" yang menggabungkan penaakulan logik dengan regresi simbolik untuk mengekstrak data daripada pengetahuan aksiomatik dan data eksperimen dalam derivasi prinsip model fenomena alam.

Penyelidikan yang bertajuk "Menggabungkan data dan teori untuk penemuan saintifik boleh terbit dengan AI-Descartes", diterbitkan pada 12 April 2023 dalam "Nature Komunikasi》.

Saintis AI” baharu menggabungkan teori dan data untuk menemui persamaan saintifik

Rangkaian saraf tiruan (NN) dan regresi statistik sering digunakan untuk menemui corak dan perhubungan dalam data secara automatik. NN mengembalikan model "kotak hitam" di mana fungsi asas biasanya digunakan hanya untuk ramalan. Dalam regresi standard, bentuk kefungsian telah ditetapkan, jadi penemuan model berjumlah pada pemasangan parameter. Dalam regresi simbolik (SR), bentuk fungsian tidak ditentukan terlebih dahulu tetapi terdiri daripada operator (cth., +, -, ×, dan ÷) daripada senarai yang diberikan dan dikira daripada data.

Model SR biasanya lebih "boleh ditafsir" berbanding model NN dan memerlukan kurang data. Oleh itu, untuk menemui undang-undang semula jadi secara simbolik daripada data eksperimen, SR mungkin lebih berkesan daripada NN atau regresi bentuk tetap, penyepaduan NN dan SR telah menjadi subjek penyelidikan terkini dalam AI neurosimbolik; Cabaran utama dalam SR ialah mengenal pasti model yang bermakna secara saintifik daripada banyak model yang sesuai dengan data. Para saintis mentakrifkan fungsi yang bermakna sebagai fungsi yang mengimbangi ketepatan dan kerumitan. Walau bagaimanapun, banyak ungkapan sedemikian wujud untuk set data tertentu, dan tidak semuanya konsisten dengan teori latar belakang yang diketahui.

Pendekatan lain ialah bermula dengan teori latar belakang yang diketahui, tetapi pada masa ini tiada alat inferens praktikal yang boleh menjana teorem yang konsisten dengan data eksperimen daripada set aksiom yang diketahui. Automatic Theorem Provers (ATP) ialah alat penaakulan yang paling banyak digunakan yang boleh membuktikan tekaan untuk teori logik tertentu. Kerumitan pengiraan adalah cabaran utama untuk ATP untuk beberapa jenis logik, membuktikan sangkaan tidak dapat ditentukan.

Tambahan pula, mendapatkan model daripada teori logik menggunakan alat penaakulan formal amat sukar apabila operator aritmetik dan kalkulus terlibat. Teknik pembelajaran mesin telah digunakan untuk meningkatkan prestasi ATP, contohnya, dengan menggunakan pembelajaran pengukuhan untuk membimbing proses carian.

Model boleh terbitan bukan sahaja harus tepat secara empirik, tetapi model tersebut harus bersifat ramalan dan berwawasan.

Penyelidik dari pasukan penyelidik IBM dan pasukan Samsung AI cuba mendapatkan model sedemikian dengan menggabungkan kaedah SR berasaskan pengoptimuman matematik baharu dengan sistem inferens. Ini menghasilkan sistem penemuan hujung ke hujung "AI-Descartes" yang mengekstrak formula daripada data melalui SR dan kemudian memberikan bukti terbitan formula daripada set aksiom, atau memberikan bukti ketidakkonsistenan. Apabila model terbukti tidak boleh terbit, penyelidik mencadangkan langkah baharu yang menunjukkan betapa hampir formula itu dengan formula terbitan, dan menggunakan sistem inferens mereka untuk mengira nilai ukuran ini.

Saintis AI” baharu menggabungkan teori dan data untuk menemui persamaan saintifik

Ilustrasi: Gambaran keseluruhan sistem. (Sumber: kertas)

Dalam kerja awal menggabungkan pembelajaran mesin dengan inferens, saintis menggunakan penerangan berasaskan logik untuk mengekang output seni bina saraf GAN yang menjana imej. Terdapat juga pasukan yang menggabungkan alat pembelajaran mesin dan enjin inferens untuk mencari bentuk berfungsi yang memenuhi kekangan yang telah ditetapkan. Ini adalah untuk menambah set data awal dengan mata baharu, sekali gus meningkatkan kecekapan kaedah pembelajaran dan ketepatan model akhir. Sesetengah pasukan juga memanfaatkan pengetahuan sedia ada untuk mencipta titik data tambahan. Walau bagaimanapun, kajian ini hanya mempertimbangkan kekangan pada bentuk fungsian untuk dipelajari dan tidak termasuk aksiom teori latar belakang umum (kekangan logik yang menerangkan undang-undang lain dan pembolehubah tidak terukur yang terlibat dalam fenomena).

Cristina Cornelio, pengarang utama kertas kerja dan saintis penyelidikan di Samsung AI, berkata AI-Descartes menawarkan beberapa kelebihan berbanding sistem lain, tetapi ciri yang paling membezakannya ialah ia keupayaan penaakulan logik. Jika terdapat berbilang persamaan calon yang sesuai dengan data dengan baik, sistem mengenal pasti persamaan yang paling sesuai dengan teori saintifik latar belakang. Keupayaan untuk menaakul juga membezakan sistem daripada program "AI generatif" seperti ChatGPT, yang model bahasanya yang besar mempunyai keupayaan logik yang terhad dan kadangkala bercelaru dengan matematik asas.

"Dalam kerja kami, kami menggabungkan kaedah prinsip pertama dengan kaedah dipacu data yang lebih biasa dalam era pembelajaran mesin, yang telah digunakan oleh saintis selama berabad-abad. "Gabungan ini membolehkan kami memanfaatkan kedua-dua pendekatan dan mencipta model yang lebih tepat dan bermakna untuk pelbagai aplikasi." >

Nama AI-Descartes ialah penghormatan kepada ahli matematik dan ahli falsafah abad ke-17, René Descartes, yang percaya bahawa dunia semula jadi boleh digambarkan oleh beberapa undang-undang fizikal asas dan kesimpulan logik memainkan peranan penting dalam penemuan saintifik.

Saintis AI” baharu menggabungkan teori dan data untuk menemui persamaan saintifik

Ilustrasi: Penjelasan kaedah saintifik pelaksanaan sistem. (Sumber: Kertas)

Penyelidik dari pasukan ini telah menunjukkan bahawa menggabungkan penaakulan logik dengan regresi simbolik adalah sangat bernilai dalam mendapatkan model simbolik yang bermakna bagi fenomena fizikal konsisten dengan teori latar belakang dan umumkan dengan baik kepada domain yang jauh lebih besar daripada data eksperimen. Gabungan regresi dan inferens menghasilkan model yang lebih baik daripada sama ada SR atau inferens logik sahaja.

Penambahbaikan atau penggantian komponen sistem individu dan pengenalan modul baharu, seperti penaakulan abduktif atau reka bentuk eksperimen akan mengembangkan fungsi keseluruhan sistem. Penyepaduan inferens dan regresi yang lebih mendalam boleh membantu mensintesis model berasaskan data dan berasaskan prinsip pertama dan membawa kepada revolusi dalam proses penemuan saintifik. Menemui model yang konsisten dengan pengetahuan sedia ada akan mempercepatkan penemuan saintifik dan mengatasi paradigma penemuan sedia ada.

Pasukan menggunakan model untuk menyimpulkan undang-undang ketiga pergerakan planet Kepler, undang-undang pelebaran masa relativistik Einstein, dan teori penjerapan Langmuir menunjukkan bahawa apabila penaakulan logik digunakan untuk Apabila membezakan formula calon dengan ralat serupa pada data, model boleh menemui corak dominan daripada sebilangan kecil titik data.

Saintis AI” baharu menggabungkan teori dan data untuk menemui persamaan saintifik

Ilustrasi: Visualisasi set berkaitan dan jaraknya. (Sumber: kertas)

"Dalam karya ini, kita memerlukan pakar manusia untuk menulis dalam cara yang formal dan boleh dibaca komputer apakah aksiom teori latar belakang, jika Jika manusia terlepas salah satu daripada mereka atau salah satu daripadanya, sistem itu tidak akan berfungsi," kata Tyler Josephson, penolong profesor kimia, biokimia dan kejuruteraan alam sekitar di UMBC. "Pada masa hadapan, kami juga berharap untuk mengautomasikan bahagian ini kerja supaya kita boleh menerokai lebih banyak bidang sains dan kejuruteraan 》

Akhirnya, pasukan berharap AI-Descartes mereka dapat memberi inspirasi kepada pendekatan saintifik baharu yang produktif, sama seperti saintis sebenar. "Salah satu aspek yang paling menarik dalam kerja kami ialah potensi untuk kemajuan yang ketara dalam penyelidikan saintifik," kata Cornelio.

Pautan kertas: https://www.nature.com/articles/s41467-023-37236-y

Laporan berkaitan: https://techxplore.com/news/2023-04-ai-scientist-combines-theory-scientific.html

Atas ialah kandungan terperinci 'Saintis AI” baharu menggabungkan teori dan data untuk menemui persamaan saintifik. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:51cto.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam