Rumah >Peranti teknologi >AI >Model pembelajaran mesin mengklasifikasikan mekanisme tindak balas organik dengan ketepatan yang luar biasa
Penemuan tindak balas kimia dipengaruhi bukan sahaja oleh seberapa cepat data eksperimen boleh diperoleh, tetapi juga oleh betapa mudahnya ahli kimia memahami data tersebut. Mendedahkan asas mekanistik tindak balas pemangkin baharu ialah masalah yang sangat kompleks yang sering memerlukan kepakaran dalam kimia organik pengiraan dan fizikal. Walau bagaimanapun, adalah penting untuk mengkaji tindak balas pemangkin kerana ia mewakili proses kimia yang paling cekap.
Baru-baru ini, Burés dan Larrosa dari Jabatan Kimia, Universiti Manchester (UoM), UK, melaporkan model pembelajaran mesin yang menunjukkan bahawa model rangkaian saraf dalam boleh dilatih untuk menganalisis dinamik biasa mempelajari data dan secara automatik menjelaskan kategori mekanistik yang sepadan tanpa sebarang input pengguna tambahan. Model ini mengenal pasti pelbagai jenis mekanisme dengan ketepatan yang sangat baik.
Penemuan menunjukkan bahawa klasifikasi mekanisme berpandukan AI ialah alat baharu yang berkuasa yang boleh memudahkan dan mengautomasikan penjelasan mekanisme. Kerja ini dijangka memajukan lagi penemuan dan pembangunan tindak balas organik automatik sepenuhnya.
Penyelidikan yang bertajuk "Klasifikasi mekanisme tindak balas organik menggunakan pembelajaran mesin", diterbitkan dalam "Nature pada 25 Januari 2023 "superior .
Pautan kertas: https://www.nature.com/articles/s41586 -022-05639-4
Tentukan penukaran substrat kepada Urutan tepat langkah-langkah asas yang terlibat dalam menghasilkan produk adalah penting untuk menambah baik kaedah sintesis secara rasional, mereka bentuk pemangkin baharu dan meningkatkan proses perindustrian dengan selamat. Untuk menjelaskan mekanisme tindak balas, pelbagai lengkung kinetik perlu dikumpulkan, dan pakar manusia mesti melakukan analisis kinetik pada data. Walaupun teknologi pemantauan tindak balas telah bertambah baik dengan ketara sejak beberapa dekad yang lalu hingga ke tahap pengumpulan data kinetik boleh diautomatikkan sepenuhnya, rangka kerja teori yang mendasari penjelasan mekanistik tidak berkembang pada kadar yang sama.
Saluran paip analisis kinetik semasa terdiri daripada tiga langkah utama: mengekstrak sifat kinetik daripada data eksperimen, meramalkan sifat kinetik untuk semua mekanisme yang mungkin dan menggabungkan sifat yang diekstrak secara eksperimen dengan ciri ramalan untuk perbandingan.
Selama lebih satu abad, ahli kimia telah mengekstrak maklumat mekanistik daripada kadar tindak balas. Satu kaedah yang masih digunakan hari ini adalah untuk menilai kadar awal tindak balas, memberi tumpuan kepada penggunaan beberapa peratus pertama bahan permulaan. Kaedah ini popular kerana dalam kebanyakan kes perubahan dalam kepekatan bahan tindak balas dari semasa ke semasa adalah linear pada permulaan tindak balas dan oleh itu mudah untuk dianalisis. Walaupun berwawasan, teknik ini mengabaikan perubahan dalam kadar tindak balas dan kepekatan yang berlaku sepanjang tempoh masa.
Sejak beberapa dekad yang lalu, kaedah yang lebih maju telah dibangunkan untuk menilai kepekatan komponen tindak balas sepanjang proses tindak balas. Kaedah ini dipermudahkan lagi oleh teknik matematik yang mendedahkan bilangan komponen yang mengambil bahagian dalam langkah tindak balas (juga dikenali sebagai susunan komponen tindak balas) daripada gambar rajah kinetik tindak balas. Teknik-teknik ini pastinya akan terus memberikan pandangan tentang kereaktifan kimia, tetapi ia terhad kepada menganalisis susunan komponen tindak balas daripada menyediakan hipotesis mekanistik yang lebih komprehensif yang menerangkan kelakuan kinetik sistem pemangkin.
Rajah 1: Perkaitan dan teknik terkini untuk analisis kinetik. (Sumber: kertas)
Pembelajaran mesin merevolusikan cara ahli kimia menyelesaikan masalah, Daripada mereka bentuk molekul dan laluan untuk mensintesis molekul untuk memahami mekanisme tindak balas. Burés dan Larrosa kini membawa revolusi ini kepada analisis kinetik dengan menggunakan model pembelajaran mesin untuk mengklasifikasikan tindak balas berdasarkan ciri kinetik simulasi mereka.
Di sini, penyelidik menunjukkan bahawa model pembelajaran mendalam yang dilatih pada data kinetik simulasi dapat menerangkan dengan betul pelbagai mekanisme daripada taburan kepekatan temporal. Model pembelajaran mesin memudahkan analisis kinetik dengan menghapuskan keperluan untuk terbitan undang-undang kadar dan pengekstrakan dan ramalan sifat kinetik, sangat memudahkan penjelasan mekanisme tindak balas dalam semua makmal sintesis.
Disebabkan analisis holistik semua data kinetik yang tersedia, kaedah ini meningkatkan keupayaan untuk menyoal keluk tindak balas, menghapuskan kemungkinan ralat manusia semasa analisis kinetik dan mengembangkan julat kinetik yang tersedia. analisis termasuk keadaan tidak mantap (termasuk proses pengaktifan dan penyahaktifan) dan tindak balas boleh balik. Pendekatan ini akan melengkapkan kaedah analisis kinetik yang ada pada masa ini dan amat berguna dalam situasi yang paling mencabar.
Para penyelidik mentakrifkan 20 kategori mekanisme tindak balas dan membangunkan undang-undang kadar untuk setiap kategori. Setiap mekanisme terdiri daripada satu set pemalar kinetik (k1, … kn ) dan kepekatan kimia digambarkan secara matematik sebagai fungsi persamaan pembezaan biasa (ODE). Mereka kemudian menyelesaikan persamaan ini, menghasilkan berjuta-juta simulasi yang menerangkan pereputan bahan tindak balas dan penghasilan produk. Data kinetik simulasi ini digunakan untuk melatih algoritma pembelajaran untuk mengenal pasti tandatangan ciri bagi setiap kelas mekanistik. Model pengelasan yang terhasil menggunakan lengkung kinetik sebagai input, termasuk data kepekatan awal dan masa, dan mengeluarkan kelas mekanistik tindak balas.
Rajah 2: Skop mekanikal dan komposisi data. (Sumber: kertas)
Latihan model pembelajaran mendalam selalunya memerlukan sejumlah besar data, yang boleh menimbulkan cabaran besar apabila data ini mesti dikumpul secara eksperimen.
Pendekatan Burés dan Larrosa untuk melatih algoritma mengelakkan kesesakan menjana sejumlah besar data kinetik eksperimen. Dalam kes ini, penyelidik dapat menyelesaikan satu set ODE secara berangka untuk menjana 5 juta sampel dinamik untuk latihan model dan pengesahan tanpa menggunakan anggaran keadaan mantap.
Model ini mengandungi 576,000 parameter boleh dilatih dan menggunakan gabungan dua jenis rangkaian saraf: (1) rangkaian saraf memori jangka pendek jangka panjang, yang digunakan untuk memproses siri data temporal ( iaitu, data kepekatan masa); (2) rangkaian neural yang disambungkan sepenuhnya untuk memproses data bukan temporal (iaitu, kepekatan awal pemangkin dalam setiap larian kinetik dan ciri yang diekstrak daripada ingatan jangka pendek yang panjang). Model mengeluarkan kebarangkalian untuk setiap mekanisme yang berjumlah 1.
Para penyelidik menilai model terlatih menggunakan set ujian lengkung kinetik simulasi dan menunjukkan bahawa ia menetapkan lengkung ini dengan betul kepada kelas mekanisme dengan ketepatan 92.6%.
Rajah 3: Prestasi model pembelajaran mesin pada set ujian, setiap lengkung kinetik mempunyai enam mata dalam masa. (Sumber: kertas)
Model berprestasi baik walaupun apabila data "bising" sengaja diperkenalkan, bermakna ia boleh digunakan untuk mengelaskan data percubaan.
Rajah 4: Kesan ralat dan bilangan titik data pada prestasi model pembelajaran mesin. (Sumber: kertas)
Akhir sekali, para penyelidik menanda aras model mereka menggunakan beberapa lengkung kinetik eksperimen yang dilaporkan sebelum ini. Mekanisme yang diramalkan adalah sesuai dengan kesimpulan kajian kinetik terdahulu. Dalam sesetengah kes, model juga mengenal pasti butiran mekanistik yang tidak dikesan dalam kerja asal. Untuk reaksi yang mencabar, model ini mencadangkan tiga kategori mekanistik yang hampir sama. Walau bagaimanapun, penulis dengan betul menyatakan bahawa keputusan ini bukan pepijat tetapi ciri model mereka, kerana ia menunjukkan bahawa eksperimen khusus lanjut diperlukan untuk meneroka mekanisme.
Rajah 5: Kajian kes dengan data kinetik eksperimen. (Sumber: kertas)
Ringkasnya, Burés dan Larrosa telah membangunkan kaedah yang bukan sahaja mengautomasikan proses yang panjang untuk mendapatkan hipotesis mekanistik daripada kajian kinetik; mekanisme tindak balas. Seperti mana-mana kemajuan teknologi dalam analisis data, klasifikasi mekanistik yang terhasil harus dilihat sebagai hipotesis yang memerlukan sokongan eksperimen selanjutnya. Selalu ada risiko salah tafsir data kinetik, tetapi keupayaan algoritma untuk mengenal pasti laluan tindak balas yang betul dengan ketepatan yang tinggi berdasarkan sebilangan kecil eksperimen boleh meyakinkan lebih ramai penyelidik untuk mencuba analisis kinetik.
Oleh itu, pendekatan ini boleh mempopularkan dan memacu penggabungan analisis kinetik ke dalam saluran paip pembangunan tindak balas, terutamanya apabila ahli kimia menjadi lebih biasa dengan algoritma pembelajaran mesin.
Atas ialah kandungan terperinci Model pembelajaran mesin mengklasifikasikan mekanisme tindak balas organik dengan ketepatan yang luar biasa. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!