


'Saintis AI” baharu menggabungkan teori dan data untuk menemui persamaan saintifik
Para saintis menyasarkan untuk menemui formula bermakna yang menerangkan data percubaan dengan tepat. Model matematik fenomena semula jadi boleh dibuat secara manual berdasarkan pengetahuan domain, atau ia boleh dibuat secara automatik daripada set data besar menggunakan algoritma pembelajaran mesin. Komuniti akademik telah mengkaji masalah penggabungan pengetahuan terdahulu yang berkaitan dan model fungsi yang berkaitan, dan percaya bahawa mencari model yang selaras dengan pengetahuan terdahulu mengenai aksiom logik am adalah masalah yang tidak dapat diselesaikan.
Penyelidik daripada pasukan penyelidik IBM dan pasukan AI Samsung membangunkan kaedah "AI-Descartes" yang menggabungkan penaakulan logik dengan regresi simbolik untuk mengekstrak data daripada pengetahuan aksiomatik dan data eksperimen dalam derivasi prinsip model fenomena alam.
Penyelidikan yang bertajuk "Menggabungkan data dan teori untuk penemuan saintifik boleh terbit dengan AI-Descartes", diterbitkan pada 12 April 2023 dalam "Nature Komunikasi》.
Rangkaian saraf tiruan (NN) dan regresi statistik sering digunakan untuk menemui corak dan perhubungan dalam data secara automatik. NN mengembalikan model "kotak hitam" di mana fungsi asas biasanya digunakan hanya untuk ramalan. Dalam regresi standard, bentuk kefungsian telah ditetapkan, jadi penemuan model berjumlah pada pemasangan parameter. Dalam regresi simbolik (SR), bentuk fungsian tidak ditentukan terlebih dahulu tetapi terdiri daripada operator (cth., +, -, ×, dan ÷) daripada senarai yang diberikan dan dikira daripada data.
Model SR biasanya lebih "boleh ditafsir" berbanding model NN dan memerlukan kurang data. Oleh itu, untuk menemui undang-undang semula jadi secara simbolik daripada data eksperimen, SR mungkin lebih berkesan daripada NN atau regresi bentuk tetap, penyepaduan NN dan SR telah menjadi subjek penyelidikan terkini dalam AI neurosimbolik; Cabaran utama dalam SR ialah mengenal pasti model yang bermakna secara saintifik daripada banyak model yang sesuai dengan data. Para saintis mentakrifkan fungsi yang bermakna sebagai fungsi yang mengimbangi ketepatan dan kerumitan. Walau bagaimanapun, banyak ungkapan sedemikian wujud untuk set data tertentu, dan tidak semuanya konsisten dengan teori latar belakang yang diketahui.
Pendekatan lain ialah bermula dengan teori latar belakang yang diketahui, tetapi pada masa ini tiada alat inferens praktikal yang boleh menjana teorem yang konsisten dengan data eksperimen daripada set aksiom yang diketahui. Automatic Theorem Provers (ATP) ialah alat penaakulan yang paling banyak digunakan yang boleh membuktikan tekaan untuk teori logik tertentu. Kerumitan pengiraan adalah cabaran utama untuk ATP untuk beberapa jenis logik, membuktikan sangkaan tidak dapat ditentukan.
Tambahan pula, mendapatkan model daripada teori logik menggunakan alat penaakulan formal amat sukar apabila operator aritmetik dan kalkulus terlibat. Teknik pembelajaran mesin telah digunakan untuk meningkatkan prestasi ATP, contohnya, dengan menggunakan pembelajaran pengukuhan untuk membimbing proses carian.
Model boleh terbitan bukan sahaja harus tepat secara empirik, tetapi model tersebut harus bersifat ramalan dan berwawasan.
Penyelidik dari pasukan penyelidik IBM dan pasukan Samsung AI cuba mendapatkan model sedemikian dengan menggabungkan kaedah SR berasaskan pengoptimuman matematik baharu dengan sistem inferens. Ini menghasilkan sistem penemuan hujung ke hujung "AI-Descartes" yang mengekstrak formula daripada data melalui SR dan kemudian memberikan bukti terbitan formula daripada set aksiom, atau memberikan bukti ketidakkonsistenan. Apabila model terbukti tidak boleh terbit, penyelidik mencadangkan langkah baharu yang menunjukkan betapa hampir formula itu dengan formula terbitan, dan menggunakan sistem inferens mereka untuk mengira nilai ukuran ini.
Ilustrasi: Gambaran keseluruhan sistem. (Sumber: kertas)
Dalam kerja awal menggabungkan pembelajaran mesin dengan inferens, saintis menggunakan penerangan berasaskan logik untuk mengekang output seni bina saraf GAN yang menjana imej. Terdapat juga pasukan yang menggabungkan alat pembelajaran mesin dan enjin inferens untuk mencari bentuk berfungsi yang memenuhi kekangan yang telah ditetapkan. Ini adalah untuk menambah set data awal dengan mata baharu, sekali gus meningkatkan kecekapan kaedah pembelajaran dan ketepatan model akhir. Sesetengah pasukan juga memanfaatkan pengetahuan sedia ada untuk mencipta titik data tambahan. Walau bagaimanapun, kajian ini hanya mempertimbangkan kekangan pada bentuk fungsian untuk dipelajari dan tidak termasuk aksiom teori latar belakang umum (kekangan logik yang menerangkan undang-undang lain dan pembolehubah tidak terukur yang terlibat dalam fenomena).
Cristina Cornelio, pengarang utama kertas kerja dan saintis penyelidikan di Samsung AI, berkata AI-Descartes menawarkan beberapa kelebihan berbanding sistem lain, tetapi ciri yang paling membezakannya ialah ia keupayaan penaakulan logik. Jika terdapat berbilang persamaan calon yang sesuai dengan data dengan baik, sistem mengenal pasti persamaan yang paling sesuai dengan teori saintifik latar belakang. Keupayaan untuk menaakul juga membezakan sistem daripada program "AI generatif" seperti ChatGPT, yang model bahasanya yang besar mempunyai keupayaan logik yang terhad dan kadangkala bercelaru dengan matematik asas.
"Dalam kerja kami, kami menggabungkan kaedah prinsip pertama dengan kaedah dipacu data yang lebih biasa dalam era pembelajaran mesin, yang telah digunakan oleh saintis selama berabad-abad. "Gabungan ini membolehkan kami memanfaatkan kedua-dua pendekatan dan mencipta model yang lebih tepat dan bermakna untuk pelbagai aplikasi." >
Nama AI-Descartes ialah penghormatan kepada ahli matematik dan ahli falsafah abad ke-17, René Descartes, yang percaya bahawa dunia semula jadi boleh digambarkan oleh beberapa undang-undang fizikal asas dan kesimpulan logik memainkan peranan penting dalam penemuan saintifik.
Ilustrasi: Penjelasan kaedah saintifik pelaksanaan sistem. (Sumber: Kertas)
Penyelidik dari pasukan ini telah menunjukkan bahawa menggabungkan penaakulan logik dengan regresi simbolik adalah sangat bernilai dalam mendapatkan model simbolik yang bermakna bagi fenomena fizikal konsisten dengan teori latar belakang dan umumkan dengan baik kepada domain yang jauh lebih besar daripada data eksperimen. Gabungan regresi dan inferens menghasilkan model yang lebih baik daripada sama ada SR atau inferens logik sahaja.Penambahbaikan atau penggantian komponen sistem individu dan pengenalan modul baharu, seperti penaakulan abduktif atau reka bentuk eksperimen akan mengembangkan fungsi keseluruhan sistem. Penyepaduan inferens dan regresi yang lebih mendalam boleh membantu mensintesis model berasaskan data dan berasaskan prinsip pertama dan membawa kepada revolusi dalam proses penemuan saintifik. Menemui model yang konsisten dengan pengetahuan sedia ada akan mempercepatkan penemuan saintifik dan mengatasi paradigma penemuan sedia ada.
Pasukan menggunakan model untuk menyimpulkan undang-undang ketiga pergerakan planet Kepler, undang-undang pelebaran masa relativistik Einstein, dan teori penjerapan Langmuir menunjukkan bahawa apabila penaakulan logik digunakan untuk Apabila membezakan formula calon dengan ralat serupa pada data, model boleh menemui corak dominan daripada sebilangan kecil titik data.
Ilustrasi: Visualisasi set berkaitan dan jaraknya. (Sumber: kertas)
"Dalam karya ini, kita memerlukan pakar manusia untuk menulis dalam cara yang formal dan boleh dibaca komputer apakah aksiom teori latar belakang, jika Jika manusia terlepas salah satu daripada mereka atau salah satu daripadanya, sistem itu tidak akan berfungsi," kata Tyler Josephson, penolong profesor kimia, biokimia dan kejuruteraan alam sekitar di UMBC. "Pada masa hadapan, kami juga berharap untuk mengautomasikan bahagian ini kerja supaya kita boleh menerokai lebih banyak bidang sains dan kejuruteraan 》Akhirnya, pasukan berharap AI-Descartes mereka dapat memberi inspirasi kepada pendekatan saintifik baharu yang produktif, sama seperti saintis sebenar. "Salah satu aspek yang paling menarik dalam kerja kami ialah potensi untuk kemajuan yang ketara dalam penyelidikan saintifik," kata Cornelio.
Pautan kertas: https://www.nature.com/articles/s41467-023-37236-y Laporan berkaitan: https://techxplore.com/news/2023-04-ai-scientist-combines-theory-scientific.html
Atas ialah kandungan terperinci 'Saintis AI” baharu menggabungkan teori dan data untuk menemui persamaan saintifik. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Krisis kapasiti yang semakin meningkat di tempat kerja, yang diburukkan lagi oleh integrasi AI yang pesat, menuntut peralihan strategik melebihi pelarasan tambahan. Ini ditegaskan oleh penemuan WTI: 68% pekerja berjuang dengan beban kerja, yang membawa kepada bursa

Hujah Bilik Cina John Searle: Cabaran untuk Memahami AI Percubaan pemikiran Searle secara langsung mempersoalkan sama ada kecerdasan buatan benar -benar dapat memahami bahasa atau mempunyai kesedaran yang benar. Bayangkan seseorang, jahil dari Chines

Gergasi teknologi China mencatatkan kursus yang berbeza dalam pembangunan AI berbanding dengan rakan -rakan Barat mereka. Daripada memberi tumpuan semata-mata kepada penanda aras teknikal dan integrasi API, mereka mengutamakan "pembantu skrin" AI-AI T-

MCP: Memperkasakan Sistem AI untuk mengakses alat luaran Protokol Konteks Model (MCP) membolehkan aplikasi AI berinteraksi dengan alat luaran dan sumber data melalui antara muka yang diseragamkan. Dibangunkan oleh antropik dan disokong oleh penyedia AI utama, MCP membolehkan model bahasa dan ejen untuk menemui alat yang ada dan memanggilnya dengan parameter yang sesuai. Walau bagaimanapun, terdapat beberapa cabaran dalam melaksanakan pelayan MCP, termasuk konflik alam sekitar, kelemahan keselamatan, dan tingkah laku silang platform yang tidak konsisten. Artikel Forbes "Protokol Konteks Model Anthropic adalah langkah besar dalam pembangunan ejen AI" Pengarang: Janakiram MsvDocker menyelesaikan masalah ini melalui kontena. Doc dibina di Infrastruktur Hab Docker

Enam strategi yang digunakan oleh usahawan berwawasan yang memanfaatkan teknologi canggih dan kecerdasan perniagaan yang cerdik untuk mewujudkan syarikat yang sangat menguntungkan dan berskala sambil mengekalkan kawalan. Panduan ini adalah untuk usahawan yang bercita -cita untuk membina a

Alat Ultra HDR baru Google Photos: Pengubah Permainan untuk Peningkatan Imej Foto Google telah memperkenalkan alat penukaran Ultra HDR yang kuat, mengubah gambar standard menjadi imej jarak jauh yang tinggi. Peningkatan ini memberi manfaat kepada jurugambar a

Senibina teknikal menyelesaikan cabaran pengesahan yang muncul Hub Identiti Agentik menangani masalah banyak organisasi yang hanya ditemui selepas permulaan pelaksanaan ejen AI bahawa kaedah pengesahan tradisional tidak direka untuk mesin-

(Nota: Google adalah pelanggan penasihat firma saya, Moor Insights & Strategy.) AI: Dari Eksperimen ke Yayasan Enterprise Google Cloud Next 2025 mempamerkan evolusi AI dari ciri eksperimen ke komponen teras teknologi perusahaan, aliran


Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

VSCode Windows 64-bit Muat Turun
Editor IDE percuma dan berkuasa yang dilancarkan oleh Microsoft

ZendStudio 13.5.1 Mac
Persekitaran pembangunan bersepadu PHP yang berkuasa

MantisBT
Mantis ialah alat pengesan kecacatan berasaskan web yang mudah digunakan yang direka untuk membantu dalam pengesanan kecacatan produk. Ia memerlukan PHP, MySQL dan pelayan web. Lihat perkhidmatan demo dan pengehosan kami.

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

mPDF
mPDF ialah perpustakaan PHP yang boleh menjana fail PDF daripada HTML yang dikodkan UTF-8. Pengarang asal, Ian Back, menulis mPDF untuk mengeluarkan fail PDF "dengan cepat" dari tapak webnya dan mengendalikan bahasa yang berbeza. Ia lebih perlahan dan menghasilkan fail yang lebih besar apabila menggunakan fon Unicode daripada skrip asal seperti HTML2FPDF, tetapi menyokong gaya CSS dsb. dan mempunyai banyak peningkatan. Menyokong hampir semua bahasa, termasuk RTL (Arab dan Ibrani) dan CJK (Cina, Jepun dan Korea). Menyokong elemen peringkat blok bersarang (seperti P, DIV),