ホームページ  >  記事  >  テクノロジー周辺機器  >  Google の科学者 Nature のコメント: 人工知能はどのようにして脳をよりよく理解できるのか

Google の科学者 Nature のコメント: 人工知能はどのようにして脳をよりよく理解できるのか

王林
王林転載
2023-11-10 08:21:47798ブラウズ

谷歌科学家 Nature 评论:人工智能如何更好地理解大脑

コンピレーション | グリーン ディオール

2023 年 11 月 7 日、Google Research の上級研究員で Google チームのコネクトミクス責任者である Viren Jain が、「Nature」誌に発表しました。 「AI が脳のより良い理解にどのようにつながるか」というタイトルのレビュー記事。

谷歌科学家 Nature 评论:人工智能如何更好地理解大脑

論文リンク: https://www.nature.com/articles/d41586-023-03426-3

コンピューターは、脳? ?これは、数学者、理論家、実験家が長年尋ねてきた問題です。人工知能 (AI) を作成したいという願望からか、あるいは数学やコンピューターが脳のような複雑なシステムを再現できる場合にのみその動作を理解できるためです。この疑問に答えようと、研究者たちは 1940 年代から脳のニューラル ネットワークの簡略化されたモデルを開発してきました。実際、今日の機械学習の爆発的な発展は、生物学的システムに触発された初期の研究に遡ることができます。

しかし、これらの取り組みの結果により、研究者は少し異なる質問をすることができるようになりました。機械学習を使用して、脳活動をシミュレートする計算モデルを構築できるでしょうか?

こうした開発の中心にあるのは、脳データの量の増加です。 1970 年代から神経科学者は、特定の瞬間の脳の静的表現を捕捉する神経結合と形態のマップであるコネクトームを作成しており、それ以来この研究は強化されています。これらの進歩に加えて、研究者は、単一細胞の解像度で経時的な神経活動の変化を測定できる機能記録を作成する能力も向上させました。一方、トランスクリプトミクスの分野では、研究者が組織サンプル内の遺伝子活性を測定し、その活性がいつどこで起こるかをマッピングすることもできます。

これまで、これらの異なるデータ ソースを接続したり、同じサンプルの脳全体から同時に収集したりする試みはほとんど行われていません。しかし、データセットの詳細レベル、サイズ、数が増加するにつれて、特に比較的単純なモデル生物の脳では、機械学習システムによって脳モデリングへの新しいアプローチが実現可能になりつつあります。これには、コネクトームやその他のデータに基づいて人工知能プログラムをトレーニングし、生物学的システムで見られると予想される神経活動を再現することが含まれます。

計算神経科学者などは、機械学習を使用して脳全体のシミュレーションを構築する前に、いくつかの課題を解決する必要があります。ただし、従来の脳モデリング技術からの情報と、さまざまなデータセットでトレーニングされた機械学習システムを組み合わせたハイブリッド アプローチを使用すると、取り組み全体をより厳密で有益なものにすることができます。

脳のマッピング

脳のマッピングの探求は、ほぼ半世紀前、線虫カエノラブディティス・エレガンスの15年間にわたる骨の折れる研究から始まりました。過去 20 年にわたり、自動化された組織切片作成とイメージングの開発により、研究者は解剖学的データをより利用しやすくなり、コンピューティングと自動画像解析の進歩により、これらのデータセットの解析が変革されました。

コネクトームは、線虫、幼虫、成虫のキイロショウジョウバエの脳全体と、マウスとヒトの脳の一部 (それぞれ 1,000 分の 1 と 100 万分の 1) に対して生成されました。

これまでに作成された解剖図には大きな欠陥があります。イメージング手法では、化学的シナプス接続とともに電気的接続を大規模にマッピングすることはできません。研究者らは主にニューロンに焦点を当ててきたが、ニューロンをサポートする非ニューロン性グリア細胞は、神経系の情報の流れにおいて重要な役割を果たしているようだ。マッピングされたニューロンやその他の細胞に発現する遺伝子やタンパク質については、まだ不明な点が多くあります。

谷歌科学家 Nature 评论:人工智能如何更好地理解大脑

それでも、このような地図はいくつかの洞察をもたらしました。たとえば、キイロショウジョウバエでは、コネクトミクスによって、研究者は攻撃性などの行動に関与する神経回路の背後にあるメカニズムを特定することができます。この脳地図はまた、ショウジョウバエが自分がどこにいるのか、ある場所から別の場所にどうやって行くのかを知る回路でどのように情報を計算しているのかも明らかにした。ゼブラフィッシュ (ダニオ・レリオ) の幼生では、コネクトミクスは、匂いの分類、目の位置と動きの制御、ナビゲーションの基礎となるシナプス回路の働きを明らかにするのに役立ちました。

最終的にマウスの脳のコネクトーム全体を生成する可能性のある取り組みが進行中ですが、現在の方法ではこれには 10 年以上かかる可能性があります。マウスの脳は、約 150,000 個のニューロンで構成されるキイロショウジョウバエの脳よりも 1,000 倍近く大きい。

コネクトミクスにおけるこれらすべての進歩に加え、研究者は単一細胞および空間トランスクリプトミクスを活用して、ますます精度と特異性が高まる遺伝子発現パターンを捕捉しています。さまざまな技術により、研究者は脊椎動物の脳全体の神経活動を一度に何時間も記録することもできます。ゼブラフィッシュ幼生の脳の場合、これは約 100,000 個のニューロンから記録することを意味します。これらには、電圧やカルシウムレベルの変化に応じて変化する蛍光特性を持つタンパク質や、単一細胞の解像度で生きた脳の3Dイメージングを可能にする顕微鏡技術が含まれます。 (この方法での神経活動の記録は、電気生理学的記録よりも正確な画像が得られませんが、機能的磁気共鳴画像法などの非侵襲的方法よりははるかに優れています。)

数学と物理学

脳活動パターンをシミュレートしようとするとき、科学者は主に物理学に基づいた方法を使用します。これには、実際のニューロンまたは実際の神経系の一部の動作の数学的記述を使用して、神経系または神経系の一部のシミュレーションを生成する必要があります。また、ネットワーク接続など、観察によって検証されていない回路の側面について情報に基づいて推測することも必要です。

場合によっては、推測が広範に及ぶこともありますが (「ミステリー モデル」を参照)、別の方法では、単一細胞および単一シナプスの解像度での解剖学的マップは、研究者が仮説を反駁し、生成するのに役立ちます。

謎のモデル

データが不足しているため、特定のニューラル ネットワーク モデルが実際のシステムで起こっていることを捉えているかどうかを評価することは困難です。

9 月に終了した物議を醸した欧州人間脳プロジェクトは、当初は人間の脳全体をコンピューターでシミュレートすることを目的としていた。その目標は放棄されましたが、このプロジェクトでは、限られた生物学的測定とさまざまな合成データ生成手順に基づいて、げっ歯類の海馬モデルにおける数万個のニューロンを含むげっ歯類と人間の脳の一部をシミュレートしました。

このアプローチの大きな問題は、詳細な解剖学的図や機能図がないと、結果として得られるシミュレーションが生物学的システムで何が起こっているかをどの程度正確に捉えているかを評価することが難しいことです。

約 70 年間、神経科学者はキイロショウジョウバエの動きの計算を可能にする回路の理論的説明を洗練させてきました。 2013 年の完成以来、動き検出回路コネクトーム、そしてその後のより大型の飛行コネクトームは、回路がどのように機能するかについてのいくつかの仮説を裏付ける詳細な回路図を提供してきました。

しかし、実際のニューラル ネットワークから収集されたデータは、解剖学主導のアプローチの限界も浮き彫りにしています。

たとえば、1990 年代に完成した神経回路モデルには、カニ (Cancer borealis) の口胃神経節 (動物の胃を制御する) を構成する約 30 個のニューロンの接続性と生理機能の詳細な分析が含まれていました。動きの構造)。研究者らは、さまざまな条件下でニューロンの活動を測定することで、比較的小さなニューロンの集合であっても、神経調節物質(ニューロンやシナプスの性質を変える物質)の導入など、一見微妙な変化も完全に活性化することを発見した。回路の動作を変更します。これは、神経回路に関する仮説を導き制約するためのコネクトームやその他の豊富なデータセットがあっても、今日のデータはモデラーが生物学的システムで何が起こっているかを把握できるほど詳細ではない可能性があることを示唆しています。

これは、機械学習が前進する方法を提供できる分野です。

コネクトームやその他のデータに基づいて数千、さらには数十億のパラメーターを最適化することで、セルラー解像度機能を使用して、実際のニューラル ネットワークの動作と一致するニューラル ネットワークの動作を生成するように機械学習モデルをトレーニングできます。測定を記録します。

この機械学習モデルは、最適化されたパラメトリック接続マップを使用してニューロンの活動電位 (膜電圧の変化全体にわたって) がどのように開始され伝播されるかを記述するホジキン・ハクスリー モデルなどの従来の脳モデリング手法からの情報を組み込むことができます。 、機能活動の記録、または脳全体について取得されたその他のデータセット。あるいは、機械学習モデルには、明示的に指定された生物学的知識はほとんど含まれないが、すべて経験的に最適化された数十億または数千億のパラメータが含まれる「ブラック ボックス」アーキテクチャを含めることもできます。

たとえば、研究者は、システムの神経活動の予測を実際の生物学的システムの記録と比較することによって、そのようなモデルを評価できます。重要なのは、機械学習プログラムにトレーニングされていないデータが与えられると、機械学習システムを評価する際の標準的な手法と同様に、モデルの予測がどのように比較されるかを評価することです。

谷歌科学家 Nature 评论:人工智能如何更好地理解大脑

マウスの脳におけるニューロンの軸索投射。 (出典: Adam Glaser、Jayaram Chandrashekar、Karel Svoboda、アレン神経力学研究所)

このアプローチにより、数千以上のニューロンを含む脳のより厳密なモデリングが可能になります。たとえば、研究者は、より詳細な生物物理学的情報を提供する複雑なモデルよりも、計算が容易な単純なモデルの方がニューラル ネットワークを適切にシミュレートできるかどうか、またはその逆を評価できるようになります。

機械学習は、他の非常に複雑なシステムの理解を向上させるために、すでにこの方法で使用されています。たとえば、1950 年代以来、天気予報システムは通常、注意深く構築された気象現象の数学的モデルに依存してきました。現代のシステムは、数百人の研究者によるそのようなモデルの改良を繰り返した結果です。しかし、過去 5 年ほどにわたって、研究者たちは機械学習を活用したいくつかの気象予測システムを開発してきました。たとえば、これらには、気圧勾配が風速の変化を引き起こす仕組みや、風速が大気中の水分をどのように移動させるかに関する仮定がほとんど含まれていません。その代わりに、機械学習を通じて何百万ものパラメータが最適化され、過去の気象パターンのデータベースと一致する気象挙動のシミュレーションが生成されます。

この方法にはいくつかの課題が伴います。モデルが正確な予測を行ったとしても、それがどのように行われるかを説明するのは困難です。さらに、モデルはトレーニング データに含まれていないシナリオを予測できないことがよくあります。今後数日を予測するように訓練された気象モデルでは、数週間または数か月先の予測を推定するのは困難です。しかし、場合によっては、数時間先の降雨量を予測する場合、機械学習手法が従来の手法を上回るパフォーマンスを発揮します。機械学習モデルには実用的な利点もあります。これらはより単純な基礎コードを使用しており、気象学の専門知識があまりない科学者でも使用できます。

脳モデリングの場合、このアプローチは、現在のデータセットのギャップの一部を埋めるのに役立ち、個々のニューロンなどの個々の生物学的構成要素のより詳細な測定の必要性を減らすのに役立ちます。一方で、より包括的なデータセットが利用可能になると、データをモデルに組み込むことが簡単になります。

Think Big

このアイデアを実現するには、いくつかの課題を解決する必要があります。

機械学習プログラムの良さは、そのプログラムのトレーニングと評価に使用されるデータによって決まります。したがって、神経科学者はサンプルの脳全体からデータセットを取得することを目指すべきであり、それがより実現可能であれば体全体からもデータセットを取得する必要があります。脳の特定の部分からデータを収集するのは簡単ですが、機械学習を使用してニューラル ネットワークなどの高度に相互接続されたシステムをモデル化しても、システムの多くの部分が基礎となるデータに存在しない場合、有用な情報が得られる可能性は低くなります。

研究者は、同じサンプルからの脳全体から神経接続の解剖学的マップと機能記録 (おそらく将来は遺伝子発現マップ) を取得することにも取り組む必要があります。現在、どちらのグループも両方ではなく、どちらか一方を取得することだけに焦点を当てる傾向があります。

ニューロン数が 302 個しかない C. エレガンスの神経系には、研究者が 1 つのサンプルから得られた接続マップが他のサンプルでも同じであると想定できる十分な配線が備わっている可能性がありますが、一部の研究ではそうではないことが示されています。しかし、キイロショウジョウバエやゼブラフィッシュ幼生などのより大きな神経系の場合、サンプル間のコネクトームの変動が大きいため、同じサンプルから得られた構造および機能データに基づいて脳モデルをトレーニングする必要があります。

現時点では、これは 2 つの一般的なモデル生物でのみ達成できます。 C.エレガンスとゼブラフィッシュ幼生の体は透明であるため、研究者は生物の脳全体から機能を記録し、個々のニューロンの活動を正確に特定することができます。このような記録の後、動物を直ちに屠殺し、樹脂に埋め込んで切片にし、神経接続の解剖学的測定を行うことができます。しかし将来的には、研究者らは、たとえば、神経活動を高解像度で記録するための、おそらくは超音波を使用した新しい非侵襲的方法を開発することによって、そのような組み合わせたデータ取得が可能な生物の範囲を拡大する可能性がある。

同じサンプルからこのようなマルチモーダルなデータセットを取得するには、研究者間の広範な協力、大規模なチームサイエンスへの投資、より包括的な取り組みのための資金提供機関のサポートの強化が必要です。しかし、このアプローチには、2016年から2021年の間に1立方ミリメートルのマウスの脳の機能的および解剖学的データを取得した米国情報先端研究プログラム活動のMICrONSプロジェクトなどの前例があります。

谷歌科学家 Nature 评论:人工智能如何更好地理解大脑

このデータを取得することに加えて、神経科学者は主要なモデリング目標と進捗状況を測定するための定量的指標について合意する必要があります。モデルの目標は、過去の状態に基づいて個々のニューロンの動作を予測することなのか、それとも脳全体なのか?単一のニューロンの活動が重要な指標となるべきでしょうか、それとも活動している数十万のニューロンの割合であるべきでしょうか?同様に、生物学的システムにおける神経活動の正確な表現を構成するものは何でしょうか?正式に合意されたベンチマークは、モデリング手法を比較し、長期にわたる進捗状況を追跡するために不可欠です。

最後に、計算神経科学者や機械学習の専門家を含む多様なコミュニティに脳モデリングの課題を提示するには、研究者はより広範な科学コミュニティに対して、どのモデリングタスクが最優先であり、そのパフォーマンスを評価するためにどの指標を使用すべきかを明確にする必要があります。モデル。 WeatherBench は、天気予報モデルを評価および比較するためのフレームワークを提供するオンライン プラットフォームで、便利なテンプレートを提供します。

主要テクノロジーの複雑さ

脳モデリングへの機械学習アプローチが科学的に有用であるかどうかを疑問視する人もいますが、それは当然のことです。脳がどのように機能するかを理解しようとする問題は、単純に大規模な人工ネットワークがどのように機能するかを理解しようとする問題に置き換えることはできるでしょうか?

しかし、視覚や嗅覚などの感覚刺激を脳がどのように処理し、エンコードするかを決定することに関係する神経科学の分野で同様の手法を使用することは、心強いことです。研究者は、機械学習システムと組み合わせて、いくつかの生物学的詳細が指定された古典的にモデル化されたニューラル ネットワークをますます使用しています。後者は、画像認識などの神経システムの視覚または聴覚能力を再現するために、大規模な視覚または音声データセットでトレーニングされます。結果として得られたネットワークは、生物学的ネットワークと顕著な類似点を示しましたが、真のニューラル ネットワークよりも分析と調査が容易でした。

今のところは、おそらく、現在の脳マッピングやその他の研究からのデータで機械学習モデルを訓練し、生物学的システムで見られるものに対応する神経活動を再現できるかどうかを問うだけで十分でしょう。ここでは、失敗さえも楽しいものになる可能性があり、マッピング研究をより深く掘り下げる必要があることを示唆しています。

以上がGoogle の科学者 Nature のコメント: 人工知能はどのようにして脳をよりよく理解できるのかの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事はjiqizhixin.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。