Rumah >Peranti teknologi >AI >Komen Google Scientist Nature: Bagaimana kecerdasan buatan boleh memahami otak dengan lebih baik

Komen Google Scientist Nature: Bagaimana kecerdasan buatan boleh memahami otak dengan lebih baik

王林
王林ke hadapan
2023-11-10 08:21:47857semak imbas

Disusun | dalam artikel ulasan "Nature" (Bagaimana AI boleh membawa kepada pemahaman yang lebih baik tentang otak).

谷歌科学家 Nature 评论:人工智能如何更好地理解大脑

Pautan kertas: https://www.nature.com/articles/d41586-023-03426-3

Bolehkah komputer diprogramkan untuk mensimulasikan otak? Ini adalah soalan yang telah lama ditanya oleh ahli matematik, ahli teori dan pakar eksperimen - sama ada kerana keinginan untuk mencipta kecerdasan buatan (AI) atau kerana tingkah lakunya hanya boleh difahami jika matematik atau komputer boleh menghasilkan semula sistem yang kompleks seperti otak. Untuk cuba menjawab soalan ini, penyelidik telah membangunkan model ringkas rangkaian saraf otak sejak tahun 1940-an. Malah, ledakan pembelajaran mesin hari ini boleh dikesan kembali kepada kerja awal yang diilhamkan oleh sistem biologi.

谷歌科学家 Nature 评论:人工智能如何更好地理解大脑Walau bagaimanapun, hasil daripada usaha ini kini membolehkan penyelidik bertanya soalan yang sedikit berbeza: Bolehkah pembelajaran mesin digunakan untuk membina model pengiraan yang mensimulasikan aktiviti otak?

Di tengah-tengah perkembangan ini adalah meningkatkan jumlah data otak. Bermula pada tahun 1970-an, ahli sains saraf telah menghasilkan penghubung, peta sambungan neuron dan morfologi yang menangkap perwakilan statik otak pada masa tertentu, dan penyelidikan ini telah dipergiatkan. Sebagai tambahan kepada kemajuan ini, penyelidik juga telah meningkatkan keupayaan mereka untuk membuat rakaman berfungsi yang boleh mengukur perubahan dalam aktiviti saraf dari semasa ke semasa pada resolusi sel tunggal. Sementara itu, bidang transkriptomi membolehkan penyelidik mengukur aktiviti gen dalam sampel tisu dan juga memetakan bila dan di mana aktiviti itu berlaku.

Setakat ini, beberapa percubaan telah dibuat untuk menyambungkan sumber data yang berbeza ini atau mengumpulnya secara serentak dari seluruh otak sampel yang sama. Tetapi apabila tahap perincian, saiz dan bilangan set data meningkat, terutamanya untuk otak organisma model yang agak mudah, sistem pembelajaran mesin menjadikan pendekatan baharu untuk pemodelan otak boleh dilaksanakan. Ini melibatkan latihan program kecerdasan buatan pada connectome dan data lain untuk menghasilkan semula aktiviti saraf yang anda harapkan dapati dalam sistem biologi.

Ahli sains saraf pengiraan dan yang lain perlu menyelesaikan beberapa cabaran sebelum mereka boleh mula menggunakan pembelajaran mesin untuk membina simulasi seluruh otak. Tetapi pendekatan hibrid yang menggabungkan maklumat daripada teknik pemodelan otak tradisional dengan sistem pembelajaran mesin yang dilatih pada set data berbeza boleh menjadikan keseluruhan usaha lebih teliti dan bermaklumat.

Pemetaan Otak

Pencarian untuk memetakan otak bermula hampir setengah abad yang lalu dengan 15 tahun penyelidikan yang teliti dalam nematod Caenorhabditis elegans. Sepanjang dua dekad yang lalu, perkembangan dalam pembahagian tisu automatik dan pengimejan telah menjadikan data anatomi lebih mudah diakses oleh penyelidik, manakala kemajuan dalam pengkomputeran dan analisis imej automatik telah mengubah analisis set data ini.

Connectomes kini telah dijana untuk keseluruhan otak C. elegans, larva dan Drosophila melanogaster dewasa, dan untuk bahagian kecil (masing-masing satu perseribu dan satu juta) otak tetikus dan manusia.

Terdapat lubang besar dalam gambarajah anatomi yang dihasilkan setakat ini. Kaedah pengimejan tidak dapat memetakan sambungan elektrik pada skala bersama-sama dengan sambungan sinaptik kimia. Penyelidik telah memberi tumpuan terutamanya pada neuron, walaupun sel glial bukan neuron yang memberikan sokongan kepada neuron kelihatan memainkan peranan penting dalam aliran maklumat dalam sistem saraf. Masih banyak yang tidak diketahui tentang gen yang dinyatakan dan protein yang terdapat dalam neuron dan sel lain yang dipetakan.

Walau bagaimanapun, peta sedemikian telah menghasilkan beberapa cerapan. Dalam Drosophila melanogaster, sebagai contoh, connectomics membolehkan penyelidik mengenal pasti mekanisme di sebalik litar saraf yang bertanggungjawab untuk tingkah laku seperti pencerobohan. Peta otak juga mendedahkan bagaimana lalat buah mengira maklumat dalam litar yang bertanggungjawab untuk mengetahui di mana mereka berada dan cara untuk pergi dari satu tempat ke tempat lain. Dalam larva ikan zebra (Danio rerio), connectomics membantu mendedahkan cara kerja litar sinaptik yang mendasari klasifikasi bau, kawalan kedudukan dan pergerakan mata serta navigasi.

Usaha yang akhirnya boleh menjana keseluruhan sambungan otak tetikus sedang dijalankan – walaupun dengan kaedah semasa, ini boleh mengambil masa sedekad atau lebih. Otak tikus hampir 1,000 kali lebih besar daripada otak Drosophila melanogaster, yang terdiri daripada kira-kira 150,000 neuron.

Selain daripada semua kemajuan dalam connectomic ini, penyelidik memanfaatkan transkriptomi sel tunggal dan ruang untuk menangkap corak ekspresi gen dengan ketepatan dan kekhususan yang semakin meningkat. Pelbagai teknik juga membolehkan penyelidik merekodkan aktiviti saraf dari seluruh otak haiwan vertebrata selama berjam-jam pada satu masa. Dalam kes otak ikan zebra larva, ini bermakna rakaman daripada hampir 100,000 neuron. Ini termasuk protein dengan sifat pendarfluor yang berubah sebagai tindak balas kepada perubahan dalam tahap voltan atau kalsium, dan teknik mikroskopi yang membolehkan pengimejan 3D otak hidup pada resolusi sel tunggal. (Rakaman aktiviti saraf dengan cara ini memberikan gambaran yang kurang tepat berbanding rakaman elektrofisiologi, tetapi jauh lebih baik daripada kaedah bukan invasif seperti pengimejan resonans magnetik berfungsi.) , saintis terutamanya menggunakan kaedah berasaskan fizik. Ini memerlukan penjanaan simulasi sistem saraf atau bahagian sistem saraf menggunakan penerangan matematik tentang kelakuan neuron sebenar atau bahagian sistem saraf sebenar. Ia juga memerlukan membuat tekaan termaklum tentang aspek litar yang belum disahkan melalui pemerhatian, seperti ketersambungan rangkaian. Dalam sesetengah kes, spekulasi adalah meluas (lihat "Model Misteri") tetapi dengan cara lain, peta anatomi pada sel tunggal dan resolusi sinaps tunggal membantu penyelidik menyangkal dan menjana hipotesis.

Model Misteri

Disebabkan kekurangan data, sukar untuk menilai sama ada model rangkaian saraf tertentu menangkap perkara yang berlaku dalam sistem sebenar.

Projek Otak Manusia Eropah yang kontroversial, yang berakhir pada bulan September, pada asalnya bertujuan untuk mensimulasikan keseluruhan otak manusia secara pengiraan. Walaupun matlamat itu ditinggalkan, projek itu mensimulasikan bahagian otak tikus dan manusia, termasuk puluhan ribu neuron dalam model hippocampus tikus, berdasarkan ukuran biologi terhad dan pelbagai prosedur penjanaan data sintetik.

Masalah utama dengan pendekatan ini ialah jika tiada gambar rajah anatomi atau fungsi yang terperinci, adalah sukar untuk menilai seberapa tepat simulasi akhir menangkap apa yang berlaku dalam sistem biologi.

Selama kira-kira tujuh puluh tahun, ahli sains saraf telah memperhalusi penerangan teori tentang litar yang membolehkan pengiraan pergerakan dalam Drosophila melanogaster. Sejak siap pada 2013, Motion Detection Circuit Connectome dan seterusnya Flight Connectome yang lebih besar telah menyediakan gambar rajah litar terperinci yang menyokong beberapa hipotesis tentang cara litar berfungsi.

Walau bagaimanapun, data yang dikumpul daripada rangkaian saraf sebenar juga menyerlahkan batasan kaedah dipacu anatomi.

Sebagai contoh, model litar saraf yang disiapkan pada tahun 1990-an termasuk analisis terperinci keterkaitan dan fisiologi kira-kira 30 neuron yang membentuk ketam (Cancer borealis) ganglion orogastrik (struktur yang mengawal pergerakan perut haiwan) . Dengan mengukur aktiviti neuron di bawah pelbagai keadaan, para penyelidik mendapati bahawa walaupun untuk koleksi neuron yang agak kecil, perubahan yang kelihatan halus, seperti pengenalan neuromodulator (bahan yang mengubah sifat neuron dan sinaps), , juga akan sepenuhnya. mengubah kelakuan litar. Ini menunjukkan bahawa walaupun dengan penyambung dan set data kaya lain untuk membimbing dan mengekang hipotesis tentang litar saraf, data hari ini mungkin tidak cukup terperinci untuk pemodel untuk menangkap apa yang berlaku dalam sistem biologi.

Ini adalah kawasan di mana pembelajaran mesin boleh menyediakan jalan ke hadapan.

Dengan mengoptimumkan beribu-ribu malah berbilion-bilion parameter berpandukan connectome dan data lain, model pembelajaran mesin boleh dilatih untuk menghasilkan gelagat rangkaian saraf selaras dengan gelagat rangkaian neural sebenar - diukur menggunakan rakaman berfungsi resolusi sel.

Model pembelajaran mesin ini boleh menggabungkan maklumat daripada teknik pemodelan otak tradisional, seperti model Hodgkin-Huxley, yang menerangkan potensi tindakan (perubahan dalam voltan transmembran) dalam neuron ) dimulakan dan disebarkan, dan menggunakan peta sambungan parametrik yang dioptimumkan, aktiviti berfungsi rekod, atau set data lain yang diperoleh untuk seluruh otak. Sebagai alternatif, model pembelajaran mesin boleh mengandungi seni bina "kotak hitam" yang mengandungi sedikit pengetahuan biologi yang dinyatakan secara eksplisit tetapi mengandungi berbilion atau ratusan bilion parameter, yang kesemuanya dioptimumkan secara empirikal.

Sebagai contoh, penyelidik boleh menilai model sedemikian dengan membandingkan ramalan aktiviti saraf sistem dengan rakaman sistem biologi sebenar. Yang penting, apabila program pembelajaran mesin diberikan data yang tidak terlatih, mereka menilai cara ramalan model dibandingkan—seperti amalan standard semasa menilai sistem pembelajaran mesin.

Unjuran akson neuron dalam otak tetikus. (Sumber: Adam Glaser, Jayaram Chandrashekar, Karel Svoboda, Allen Institute for Neurodynamics)

Pendekatan ini akan membolehkan pemodelan otak yang lebih ketat yang mengandungi beribu-ribu atau lebih neuron. Sebagai contoh, penyelidik akan dapat menilai sama ada model yang lebih mudah yang lebih mudah untuk mengira simulasi rangkaian saraf lebih baik daripada model yang lebih kompleks yang memberikan maklumat biofizikal yang lebih terperinci, dan sebaliknya.

Pembelajaran mesin sudah digunakan dengan cara ini untuk meningkatkan pemahaman tentang sistem lain yang sangat kompleks. Sebagai contoh, sejak tahun 1950-an, sistem ramalan cuaca lazimnya bergantung pada model matematik fenomena meteorologi yang dibina dengan teliti, dan sistem moden adalah hasil daripada penghalusan berulang model sedemikian oleh ratusan penyelidik. Walau bagaimanapun, dalam tempoh lima tahun yang lalu atau lebih, penyelidik telah membangunkan beberapa sistem ramalan cuaca yang memanfaatkan pembelajaran mesin. Sebagai contoh, ini mengandungi lebih sedikit andaian yang berkaitan dengan cara kecerunan tekanan mendorong perubahan dalam kelajuan angin dan cara kelajuan angin menggerakkan kelembapan melalui atmosfera. Sebaliknya, berjuta-juta parameter dioptimumkan melalui pembelajaran mesin untuk menghasilkan gelagat cuaca simulasi yang konsisten dengan pangkalan data corak cuaca masa lalu.

Cara melakukan perkara ini memang datang dengan beberapa cabaran. Walaupun model membuat ramalan yang tepat, sukar untuk menerangkan cara model itu melakukannya. Selain itu, model sering gagal meramalkan senario yang tidak disertakan dalam data latihan mereka. Model cuaca yang dilatih untuk meramalkan beberapa hari akan datang mengalami kesukaran mengekstrapolasi ramalan kepada minggu atau bulan ke hadapan. Tetapi dalam beberapa kes - untuk meramalkan hujan beberapa jam ke hadapan - kaedah pembelajaran mesin telah mengatasi kaedah tradisional. Model pembelajaran mesin juga mempunyai kelebihan praktikal. Mereka menggunakan kod asas yang lebih mudah dan boleh digunakan oleh saintis yang kurang pengetahuan meteorologi khusus.

Untuk pemodelan otak, di satu pihak, pendekatan ini boleh membantu mengisi beberapa jurang dalam set data semasa dan mengurangkan keperluan untuk pengukuran yang lebih terperinci bagi komponen biologi individu, seperti neuron individu. Sebaliknya, apabila set data yang lebih komprehensif tersedia, menggabungkan data ke dalam model akan menjadi mudah.

Think Big

Untuk merealisasikan idea ini, terdapat beberapa cabaran yang perlu diselesaikan.

Program pembelajaran mesin hanya sebaik data yang digunakan untuk melatih dan menilainya. Oleh itu, ahli sains saraf harus menyasarkan untuk mendapatkan set data dari seluruh otak sampel-atau bahkan seluruh badan, jika ini menjadi lebih dapat dilaksanakan. Walaupun lebih mudah untuk mengumpul data dari bahagian otak tertentu, menggunakan pembelajaran mesin untuk memodelkan sistem yang sangat saling berkaitan, seperti rangkaian saraf, tidak mungkin menghasilkan maklumat berguna jika banyak bahagian sistem tidak terdapat dalam data asas .

Penyelidik juga harus berusaha untuk mendapatkan peta anatomi sambungan saraf dan rakaman berfungsi (dan mungkin dalam peta ekspresi gen masa hadapan) daripada keseluruhan otak daripada sampel yang sama. Pada masa ini, mana-mana kumpulan cenderung untuk memberi tumpuan semata-mata untuk mendapatkan satu atau yang lain, bukannya kedua-duanya.

Dengan hanya 302 neuron, sistem saraf C. elegans mungkin mempunyai pendawaian keras yang mencukupi untuk membolehkan penyelidik menganggap bahawa peta ketersambungan yang diperoleh daripada satu sampel adalah sama untuk mana-mana sampel lain - walaupun sesetengah kajian mencadangkan sebaliknya. Tetapi untuk sistem saraf yang lebih besar, seperti larva Drosophila melanogaster dan zebrafish, variasi connectome antara sampel adalah penting, jadi model otak harus dilatih mengenai data struktur dan berfungsi yang diperoleh daripada sampel yang sama.

Pada masa ini, ini hanya boleh dilakukan dalam dua organisma model biasa. Badan C. elegans dan larva ikan zebra adalah telus, bermakna penyelidik boleh membuat rakaman berfungsi dari seluruh otak organisma dan menentukan aktiviti neuron individu. Berikutan rakaman sedemikian, haiwan boleh dibunuh serta-merta, tertanam dalam resin dan dibelah, dan pengukuran anatomi sambungan saraf dibuat. Walau bagaimanapun, pada masa hadapan, penyelidik boleh mengembangkan julat organisma yang mana pemerolehan data gabungan sedemikian mungkin, contohnya, dengan membangunkan kaedah bukan invasif baharu, mungkin menggunakan ultrasound, untuk merekodkan aktiviti saraf pada resolusi tinggi.

Mendapatkan set data berbilang mod dalam sampel yang sama memerlukan kerjasama yang meluas dalam kalangan penyelidik, pelaburan dalam sains pasukan besar dan sokongan agensi pembiayaan yang dipertingkatkan untuk usaha yang lebih komprehensif. Tetapi terdapat duluan untuk pendekatan ini, seperti projek MICrONS Aktiviti Program Penyelidikan Lanjutan Perisikan A.S., yang memperoleh data fungsional dan anatomi pada 1 milimeter padu otak tetikus antara 2016 dan 2021.

谷歌科学家 Nature 评论:人工智能如何更好地理解大脑

Selain mendapatkan data ini, ahli sains saraf perlu bersetuju dengan matlamat pemodelan utama dan metrik kuantitatif untuk mengukur kemajuan. Sekiranya matlamat model itu adalah untuk meramalkan tingkah laku neuron individu berdasarkan keadaan masa lalu atau keseluruhan otak? Sekiranya aktiviti neuron tunggal menjadi metrik utama, atau adakah ia menjadi peratusan ratusan ribu neuron aktif? Begitu juga, apakah yang membentuk perwakilan tepat aktiviti saraf dalam sistem biologi? Penanda aras formal yang dipersetujui adalah penting untuk membandingkan pendekatan pemodelan dan menjejaki kemajuan dari semasa ke semasa.

Akhir sekali, untuk membentangkan cabaran pemodelan otak kepada pelbagai komuniti termasuk ahli sains saraf pengiraan dan pakar pembelajaran mesin, penyelidik perlu menjelaskan kepada komuniti saintifik yang lebih luas tugas pemodelan mana yang menjadi keutamaan tertinggi dan metrik yang harus digunakan untuk menilai prestasi model mereka. WeatherBench, platform dalam talian yang menyediakan rangka kerja untuk menilai dan membandingkan model ramalan cuaca, menyediakan templat yang berguna.

Kerumitan Teknik Utama

Sesetengah akan mempersoalkan – dan memang betul – sama ada pendekatan pembelajaran mesin kepada pemodelan otak berguna secara saintifik. Bolehkah masalah cuba memahami bagaimana otak berfungsi hanya digantikan dengan masalah cuba memahami bagaimana rangkaian buatan yang besar berfungsi?

Walau bagaimanapun, adalah menggalakkan untuk melihat pendekatan serupa digunakan dalam cabang-cabang neurosains yang terlibat dalam menentukan bagaimana otak memproses dan mengekod rangsangan deria seperti penglihatan dan bau. Penyelidik semakin menggunakan rangkaian neural model klasik, di mana beberapa butiran biologi ditentukan, digabungkan dengan sistem pembelajaran mesin. Yang terakhir dilatih pada set data visual atau audio yang besar untuk menghasilkan semula kebolehan visual atau pendengaran sistem saraf, seperti pengecaman imej. Rangkaian yang terhasil menunjukkan persamaan yang ketara dengan rangkaian biologi, tetapi lebih mudah untuk dianalisis dan disoal siasat daripada rangkaian saraf sebenar.

Buat masa ini, mungkin hanya perlu bertanya sama ada data daripada atlas otak semasa dan kerja lain boleh melatih model pembelajaran mesin untuk menghasilkan semula aktiviti saraf yang sepadan dengan apa yang dilihat dalam sistem biologi. Di sini, walaupun kegagalan boleh menjadi menyeronokkan - mencadangkan bahawa penyelidikan pemetaan mesti pergi lebih mendalam.

Atas ialah kandungan terperinci Komen Google Scientist Nature: Bagaimana kecerdasan buatan boleh memahami otak dengan lebih baik. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:jiqizhixin.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam