Rumah > Artikel > Peranti teknologi > Terokai asal usul alam semula jadi! Buletin ketujuh ringkasan akhir tahun 2022 Google: Bagaimanakah 'Bahan Persekitaran Biokimia' boleh menuai dividen pembelajaran mesin?
Dengan kemajuan besar dalam pembelajaran mesin dan pengkomputeran kuantum, kami kini mempunyai alatan baharu dan lebih berkuasa untuk bekerjasama dengan penyelidik merentas industri dengan cara baharu dan mempercepatkan kemajuan penemuan saintifik yang terobosan secara radikal.
Tema ringkasan akhir tahun Google ini ialah "Sains Alam" Pengarang artikel itu ialah John Platt, seorang saintis yang cemerlang di Google Research lulus dari Caltech dengan Ph.D pada tahun 1989.
Sejak menyertai Google Research lapan tahun yang lalu, saya telah mendapat keistimewaan untuk menjadi sebahagian daripada komuniti penyelidik berbakat yang berdedikasi untuk Bertujuan untuk menggunakan teknologi pengkomputeran termaju untuk memajukan kemungkinan sains gunaan, pasukan kini meneroka topik dalam sains fizikal dan semula jadi, daripada membantu menyusun maklumat protein dan genomik dunia untuk memberi manfaat kepada kehidupan manusia, untuk menggunakan komputer kuantum untuk meningkatkan pemahaman kita tentang alam semesta.
Kerumitan biologi yang luar biasa telah menarik perhatian ramai penyelidik, daripada meneroka misteri otak hingga meneroka struktur protein , kepada pengekodan genom bahasa kehidupan, Google telah bekerjasama dengan saintis daripada organisasi terkemuka lain di seluruh dunia untuk menangani cabaran besar dalam connectomic, ramalan fungsi protein dan genomik, dan untuk menyediakan inovasi kepada komuniti yang lebih luas komuniti saintifik.
Neurobiologi
Pada tahun 2018, aplikasi yang dibangunkan oleh Google adalah untuk meneroka maklumat adalah dihantar melalui laluan neuron dalam otak ikan zebra, memberikan pandangan tentang cara ikan zebra terlibat dalam tingkah laku sosial seperti berkerumun.
Pautan kertas: https://www.nature.com/articles/s41592-018-0049-4
Bekerjasama dengan penyelidik di Max Planck Institute for Biology Intelligence, penyelidik menggunakan komputer untuk mencipta semula sebahagian daripada imej mikroskop elektron 3D zebra otak ikan.
Ini juga merupakan peristiwa penting dalam penggunaan pengimejan dan saluran paip pengiraan untuk memetakan litar neuron dalam otak kecil, Ia adalah juga satu lagi kemajuan dalam bidang connectomics.
Teknologi yang terlibat dalam kerja ini malah boleh digunakan untuk bidang di luar neurosains Contohnya, untuk menyelesaikan masalah pemprosesan set data connectomics yang besar, penyelidik di Google membangunkan dan Mengeluarkan TensorStore. , perpustakaan perisian C++ dan Python sumber terbuka yang direka khusus untuk menyimpan dan mengendalikan data n-dimensi, dan juga sesuai untuk menyimpan set data yang besar dalam medan lain.
Pautan kod: https://github.com/google/tensorstore
Dengan membandingkan pemprosesan bahasa manusia dengan model bahasa dalam autoregresif (DLM), penyelidik telah menggunakan pembelajaran mesin untuk menerangkan cara otak manusia melaksanakan fungsi yang tersendiri seperti bahasa.
Pautan kertas: https://www.nature.com/articles/s41593-022-01026 -4
Dalam kajian ini, Google bekerjasama dengan penyelidik di Princeton University dan NYU Grossman School of Medicine untuk meminta peserta mendengar podcast selama 30 minit juga direkodkan menggunakan elektroensefalografi kortikal.
Keputusan yang direkodkan menunjukkan bahawa otak manusia dan DLM berkongsi prinsip pengiraan untuk memproses bahasa, termasuk ramalan perkataan seterusnya yang berterusan, pembenaman bergantung konteks dan pengiraan kejutan selepas permulaan berdasarkan padanan perkataan, iaitu otak manusia boleh mengukur Darjah kejutan perkataan dan mengaitkan isyarat kejutan dengan tahap ramalan perkataan oleh DLM.
Hasil ini memberikan kesimpulan baharu tentang pemprosesan bahasa dalam otak manusia dan mencadangkan bahawa DLM boleh digunakan untuk mendedahkan cerapan berharga ke dalam asas saraf bahasa.
Biokimia
Pembelajaran mesin juga telah membawa kepada kemajuan yang ketara dalam memahami urutan biologi Kemajuan , penyelidik memanfaatkan kemajuan terkini dalam pembelajaran mendalam untuk meramal dengan tepat fungsi protein daripada jujukan asid amino mentah.
Pautan kertas: https://www.nature.com/articles/s41587-021-01179-w
Google juga bekerjasama rapat dengan Institut Bioinformatik Eropah (EMBL-EBI) Makmal Biologi Molekul Eropah (EMBL-EBI) untuk menilai dengan teliti prestasi model dan telah menambahkan ratusan juta protein pada pangkalan data protein awam fungsi UniProt, Pfam/interPro dan MGnify anotasi.
Pautan kertas: https://www.nature.com/articles/s41587-021-01179 -w.epdf
Anotasi manusia bagi pangkalan data protein mungkin merupakan proses yang sukar dan perlahan, tetapi kaedah pembelajaran mesin yang dicadangkan oleh Google telah menjadikan kelajuan anotasi sebagai lonjakan yang besar.
Contohnya, anotasi Pfam telah berkembang lebih daripada semua usaha lain dalam dekad yang lalu digabungkan, dan berjuta-juta saintis di seluruh dunia yang mengakses pangkalan data ini setiap tahun kini boleh memanfaatkan anotasi itu untuk penyelidikan.
Walaupun draf pertama genom manusia dikeluarkan pada tahun 2003, ia tidak disiapkan kerana had teknikal penjujukan teknologi tidak lengkap.
Pada tahun 2022, konsortium Telomere-2-Telomere (T2T) sedang berusaha untuk menyelesaikan kawasan yang sebelum ini tidak boleh diakses (termasuk 5 lengan kromosom lengkap dan hampir 200 juta pangkalan jujukan DNA baharu). pencapaian telah dicapai dalam mengkaji bidang yang menarik dan penting kepada persoalan biologi manusia, evolusi dan penyakit.
Pemanggil varian genom sumber terbuka Google, DeepVariant, ialah salah satu alat yang digunakan oleh Konsortium T2T untuk mempersiapkan pengeluaran jujukan genom manusia pasangan asas 3.055 bilion yang lengkap.
Pautan kertas: https://www.nature.com/articles/nbt.4235
Konsortium T2T juga menggunakan pendekatan sumber terbuka Google DeepConsensus untuk menyediakan pembetulan ralat pada peranti untuk instrumen penjujukan Pacific Biosciences yang sudah lama dibaca, dalam kajian terbaru T2T tentang genom pan komprehensif sumber , boleh mewakili keluasan kepelbagaian genetik manusia.
Pautan kertas: https://www.nature.com/articles/s41587-022-01435 -7.epdf
Pengkomputeran kuantum masih di peringkat awal apabila ia datang untuk mempromosikan penemuan saintifik, tetapi ia mempunyai Potensi yang besar, jadi Google sedang meneroka cara untuk meningkatkan keupayaan pengkomputeran kuantum supaya pengkomputeran kuantum boleh menjadi alat untuk penemuan dan penemuan saintifik.
Dengan bekerjasama dengan ahli fizik dari seluruh dunia, penyelidik mula menggunakan komputer kuantum sedia ada untuk mencipta eksperimen fizik yang benar-benar baharu Salah satu masalah eksperimen kuantum ialah: apabila penderia mengukur Bila mengesan objek, komputer diperlukan untuk memproses data daripada penderia.
Dalam proses pemprosesan tradisional, data sensor perlu ditukar kepada maklumat klasik sebelum diproses.
Untuk pengkomputeran kuantum, data kuantum daripada penderia boleh diproses terus, dan data daripada penderia kuantum boleh diberikan terus kepada algoritma kuantum tanpa pengukuran, yang akan mempunyai kelebihan yang lebih besar daripada komputer tradisional.
Pautan kertas: https://www.science.org/doi/10.1126/science.abn7293
Dalam kertas Sains yang diterbitkan baru-baru ini oleh Google dengan kerjasama penyelidik dari pelbagai universiti, hasil percubaan menunjukkan bahawa selagi komputer kuantum digandingkan terus dengan penderia kuantum dan berjalan Algoritma pembelajaran, pengkomputeran kuantum boleh mengekstrak maklumat daripada eksperimen yang jauh lebih sedikit daripada pengkomputeran klasik.
Walaupun pada komputer kuantum skala pertengahan yang belum matang pada masa ini, "pembelajaran mesin kuantum" boleh menghasilkan kelebihan eksponen pada set data.
Pautan kertas: https://arxiv.org/abs/2112.00778
Memandangkan data eksperimen selalunya menjadi faktor pengehad dalam penemuan saintifik, algoritma pembelajaran mesin kuantum berpotensi untuk mengeluarkan sepenuhnya kuasa komputer kuantum yang lebih baik ialah hasil kerja ini juga boleh digunakan kepada pembelajaran Output pengkomputeran kuantum, seperti output simulasi kuantum, adalah sukar untuk diekstrak.
Walaupun tanpa pembelajaran mesin kuantum, aplikasi komputer kuantum yang menjanjikan ialah penerokaan eksperimen sistem kuantum yang tidak boleh diperhatikan atau disimulasikan.
Pada tahun 2022, pasukan Quantum AI menggunakan kaedah ini untuk memerhati bukti eksperimen pertama bagi berbilang foton gelombang mikro dalam keadaan terikat menggunakan qubit superkonduktor.
Pautan kertas: https://www.nature.com/articles/s41586-022-05348 -y
Foto biasanya memerlukan elemen tak linear tambahan untuk berinteraksi Hasil simulasi komputer kuantum Google bagi interaksi ini mengejutkan penyelidik: mereka pada asalnya menjangkakan ini Kewujudan keadaan terikat bergantung. pada keadaan yang rapuh, tetapi mereka sebenarnya didapati teguh walaupun untuk gangguan yang agak kuat.
Memandangkan kejayaan awal Google dalam menggunakan pengkomputeran kuantum untuk mencapai kejayaan dalam fizik, penyelidik teruja dengan teknologi Kemungkinan juga memegang janji yang besar, membolehkan penemuan terobosan masa depan mempunyai kesan sosial yang sama pentingnya dengan penciptaan transistor atau Sistem Penentududukan Global.
Pengkomputeran kuantum sebagai alat saintifik sangat menjanjikan!
Atas ialah kandungan terperinci Terokai asal usul alam semula jadi! Buletin ketujuh ringkasan akhir tahun 2022 Google: Bagaimanakah 'Bahan Persekitaran Biokimia' boleh menuai dividen pembelajaran mesin?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!