편집 | Green Dill
2023년 11월 7일, Google Research의 수석 연구 과학자이자 Google 팀의 Connectomics 책임자인 Viren Jain은 "인공 지능이 뇌를 더 잘 이해할 수 있는 방법"이라는 제목의 논문을 발표했습니다. "자연"(AI가 어떻게 뇌를 더 잘 이해할 수 있는지) 리뷰 기사에서.
문서 링크: https://www.nature.com/articles/d41586-023-03426-3
컴퓨터를 프로그래밍하여 뇌를 시뮬레이션할 수 있나요? 이는 수학자, 이론가, 실험가들이 인공 지능(AI)을 만들고자 하는 욕구에서 비롯된 것인지, 아니면 수학과 컴퓨터가 이를 재현할 수 있는 경우에만 그 행동을 이해할 수 있기 때문에 오랫동안 질문해 왔던 질문입니다. 뇌와 같은 복잡한 시스템입니다. 이 질문에 답하기 위해 연구자들은 1940년대부터 뇌 신경망의 단순화된 모델을 개발해 왔습니다. 실제로 오늘날 머신러닝의 폭발적인 증가는 생물학적 시스템에서 영감을 받은 초기 작업으로 거슬러 올라갑니다.
그러나 이러한 노력의 결과로 이제 연구자들은 약간 다른 질문을 할 수 있게 되었습니다. 기계 학습을 사용하여 뇌 활동을 시뮬레이션하는 계산 모델을 구축할 수 있습니까?
이러한 발전의 중심에는 뇌 데이터의 양이 늘어나고 있습니다. 1970년대부터 신경과학자들은 커넥톰, 신경 연결 지도, 특정 순간에 뇌의 정적인 표현을 포착하는 형태학을 생산해 왔으며, 이후 이 연구가 더욱 강화되었습니다. 이러한 발전에 더해 연구자들은 단일 세포의 분해능으로 시간 경과에 따른 신경 활동의 변화를 측정할 수 있는 기능적 기록을 만드는 능력도 향상시켰습니다. 한편, 전사체학(transcriptomics) 분야를 통해 연구자들은 조직 샘플에서 유전자 활동을 측정하고 해당 활동이 언제 어디서 발생하는지 지도화할 수도 있습니다.
지금까지 이러한 서로 다른 데이터 소스를 연결하거나 동일한 샘플의 전체 뇌에서 동시에 수집하려는 시도는 거의 없었습니다. 그러나 특히 상대적으로 단순한 모델 유기체의 뇌에 대한 데이터 세트의 세부 수준, 크기 및 수가 증가함에 따라 기계 학습 시스템은 뇌 모델링에 대한 새로운 접근 방식을 실현 가능하게 만들고 있습니다. 여기에는 생물학적 시스템에서 발견할 것으로 예상되는 신경 활동을 재현하기 위해 커넥톰 및 기타 데이터에 대한 인공 지능 프로그램을 훈련시키는 것이 포함됩니다.
컴퓨터 신경과학자 등은 기계 학습을 사용하여 뇌 전체의 시뮬레이션을 구축하기 전에 몇 가지 과제를 해결해야 합니다. 그러나 전통적인 뇌 모델링 기술의 정보를 다양한 데이터 세트에서 훈련된 기계 학습 시스템과 결합하는 하이브리드 접근 방식은 전체 노력을 더욱 엄격하고 유익하게 만들 수 있습니다.
뇌 지도 작성 탐구는 거의 반세기 전 선충류 Caenorhabditis elegans에 대한 15년간의 고된 연구로 시작되었습니다. 지난 20년 동안 자동화된 조직 절개 및 영상화의 발전으로 연구자들이 해부학적 데이터에 더 쉽게 접근할 수 있게 되었으며, 컴퓨팅 및 자동화된 이미지 분석의 발전으로 이러한 데이터 세트의 분석이 변화되었습니다.
이제 C. elegans, 유충 및 성체 Drosophila melanogaster의 전체 뇌와 마우스 및 인간 뇌의 작은 부분(각각 1000분의 1 및 100만분의 1)에 대한 Connectome이 생성되었습니다.
지금까지 제작된 해부도에는 큰 구멍이 있습니다. 이미징 방법으로는 화학적 시냅스 연결과 함께 대규모 전기 연결을 매핑할 수 없었습니다. 뉴런을 지원하는 비뉴런 신경교세포가 신경계의 정보 흐름에 중요한 역할을 하는 것으로 보이지만 연구자들은 주로 뉴런에 초점을 맞춰 왔습니다. 발현된 유전자와 뉴런 및 매핑된 다른 세포에 존재하는 단백질에 대해서는 아직 많은 것이 알려져 있지 않습니다.
그럼에도 불구하고 이러한 지도는 몇 가지 통찰력을 제공했습니다. 예를 들어 Drosophila melanogaster의 경우 커넥토믹스를 통해 연구자들은 공격성과 같은 행동을 담당하는 신경 회로 뒤에 있는 메커니즘을 식별할 수 있습니다. 뇌 지도는 또한 초파리가 자신의 위치와 한 장소에서 다른 장소로 이동하는 방법을 아는 회로에서 정보를 어떻게 계산하는지 보여줍니다. 제브라피시(Danio rerio) 유충에서 커넥토믹스는 냄새 분류, 눈 위치 및 움직임 제어, 탐색의 기본이 되는 시냅스 회로의 작동을 밝히는 데 도움이 되었습니다.
결국 쥐의 뇌 커넥톰 전체를 생성할 수 있는 노력이 진행 중입니다. 현재 방법으로는 10년 이상이 걸릴 수 있습니다. 쥐의 뇌는 약 150,000개의 뉴런으로 구성된 Drosophila melanogaster의 뇌보다 거의 1,000배 더 큽니다.
커넥토믹스의 이러한 모든 발전 외에도 연구자들은 단일 세포 및 공간 전사체학을 활용하여 점점 더 정확하고 특이성 있게 유전자 발현 패턴을 포착하고 있습니다. 또한 다양한 기술을 통해 연구자들은 척추동물의 뇌 전체에서 한 번에 몇 시간 동안 신경 활동을 기록할 수 있습니다. 애벌레 제브라피시 뇌의 경우 이는 거의 100,000개의 뉴런에서 기록된다는 것을 의미합니다. 여기에는 전압이나 칼슘 수준의 변화에 반응하여 변화하는 형광 특성을 가진 단백질과 단일 세포 해상도에서 살아있는 뇌의 3D 이미징을 가능하게 하는 현미경 기술이 포함됩니다. (이런 방식으로 신경 활동을 기록하는 것은 전기생리학적 기록보다 정확도가 떨어지지만 기능성 자기공명영상과 같은 비침습적 방법보다는 훨씬 좋습니다.)
뇌 활동을 모델링하려는 경우 모델링할 때 , 과학자들은 주로 물리학 기반 방법을 사용합니다. 이를 위해서는 실제 뉴런 또는 실제 신경계 부분의 동작에 대한 수학적 설명을 사용하여 신경계 또는 신경계 부분의 시뮬레이션을 생성해야 합니다. 또한 네트워크 연결과 같이 관찰을 통해 확인되지 않은 회로 측면에 대해 정보에 입각한 추측을 해야 합니다.
어떤 경우에는 추측이 광범위하지만("미스터리 모델" 참조) 다른 면에서는 단일 세포 및 단일 시냅스 해상도의 해부학적 지도가 연구자가 가설을 반박하고 생성하는 데 도움이 됩니다.
신비한 모델
데이터 부족으로 인해 특정 신경망 모델이 실제 시스템에서 일어나는 일을 포착하는지 여부를 평가하기 어렵습니다.
9월에 종료된 논란의 여지가 있는 유럽 인간 두뇌 프로젝트는 원래 인간 두뇌 전체를 계산적으로 시뮬레이션하는 것을 목표로 했습니다. 비록 그 목표는 포기되었지만, 이 프로젝트는 제한된 생물학적 측정과 다양한 합성 데이터 생성 절차를 기반으로 설치류 해마 모델의 수만 개의 뉴런을 포함하여 설치류와 인간 두뇌의 일부를 시뮬레이션했습니다.
이 접근 방식의 주요 문제점은 상세한 해부학적 또는 기능적 다이어그램이 없으면 최종 시뮬레이션이 생물학적 시스템에서 일어나는 일을 얼마나 정확하게 포착하는지 평가하기 어렵다는 것입니다.
약 70년 동안 신경과학자들은 Drosophila melanogaster의 움직임을 계산할 수 있는 회로에 대한 이론적 설명을 개선해 왔습니다. 2013년에 완성된 이후 동작 감지 회로 Connectome과 이후의 더 큰 Flight Connectome은 회로 작동 방식에 대한 몇 가지 가설을 뒷받침하는 상세한 회로 다이어그램을 제공했습니다.
그러나 실제 신경망에서 수집된 데이터는 해부학 중심 방법의 한계도 강조합니다.
예를 들어, 1990년대에 완성된 신경 회로 모델에는 게(보레알리스 암) 입위 신경절(동물의 위 움직임을 제어하는 구조)을 구성하는 약 30개 뉴런의 연결성과 생리학에 대한 상세한 분석이 포함되었습니다. . 연구진은 다양한 조건에서 뉴런의 활동을 측정함으로써 상대적으로 작은 뉴런 집합의 경우에도 신경 조절제(뉴런과 시냅스의 특성을 바꾸는 물질)의 도입과 같이 겉보기에 미묘한 변화가 완전히 발생한다는 것을 발견했습니다. 회로의 동작을 변경합니다. 이는 신경 회로에 대한 가설을 안내하고 제한하기 위한 커넥톰 및 기타 풍부한 데이터 세트가 있더라도 오늘날의 데이터는 모델러가 생물학적 시스템에서 일어나는 일을 포착할 만큼 충분히 상세하지 않을 수 있음을 시사합니다.
이것은 머신러닝이 발전할 수 있는 영역입니다.
커넥텀 및 기타 데이터에 따라 수천 또는 수십억 개의 매개변수를 최적화함으로써 기계 학습 모델은 셀 해상도 기능 기록을 사용하여 측정된 실제 신경망 동작과 일치하는 신경망 동작을 생성하도록 훈련될 수 있습니다.
이 기계 학습 모델은 뉴런의 활동 전위(막 투과 전압의 변화)가 시작되고 전파되는 것을 설명하는 Hodgkin-Huxley 모델과 같은 전통적인 뇌 모델링 기술의 정보를 통합할 수 있으며 최적화된 매개변수 연결 맵, 기능적 활동을 사용합니다. 기록 또는 전체 뇌에 대해 얻은 기타 데이터 세트. 또는 기계 학습 모델에는 명시적으로 지정된 생물학적 지식이 거의 없지만 경험적으로 최적화된 수십억 또는 수천억 개의 매개변수를 포함하는 "블랙박스" 아키텍처가 포함될 수 있습니다.
예를 들어, 연구자들은 시스템의 신경 활동에 대한 예측을 실제 생물학적 시스템의 기록과 비교하여 이러한 모델을 평가할 수 있습니다. 결정적으로, 기계 학습 프로그램에 훈련되지 않은 데이터가 제공되면 기계 학습 시스템을 평가할 때의 표준 관행과 마찬가지로 모델의 예측이 어떻게 비교되는지 평가합니다.
쥐 뇌의 뉴런 축삭 돌기. (출처: Adam Glaser, Jayaram Chandrashekar, Karel Svoboda, Allen Institute for Neurodynamics)
이 접근 방식을 사용하면 수천 개 이상의 뉴런을 포함하는 뇌에 대한 보다 엄격한 모델링이 가능해집니다. 예를 들어, 연구자들은 더 자세한 생물물리학적 정보를 제공하는 복잡한 모델보다 계산하기 쉬운 간단한 모델이 신경망을 더 잘 시뮬레이션하는지 여부를 평가할 수 있으며 그 반대의 경우도 마찬가지입니다.
다른 매우 복잡한 시스템에 대한 이해를 높이기 위해 기계 학습이 이미 이러한 방식으로 사용되고 있습니다. 예를 들어, 1950년대 이후 날씨 예측 시스템은 일반적으로 기상 현상에 대해 세심하게 구성된 수학적 모델에 의존해 왔으며, 현대 시스템은 수백 명의 연구자가 그러한 모델을 반복적으로 개선한 결과입니다. 그러나 지난 5년 정도 동안 연구원들은 기계 학습을 활용하는 여러 가지 날씨 예측 시스템을 개발했습니다. 예를 들어, 여기에는 압력 구배가 풍속 변화를 유도하는 방식과 풍속이 대기를 통해 습기를 이동시키는 방식과 관련된 가정이 더 적습니다. 대신, 수백만 개의 매개변수가 기계 학습을 통해 최적화되어 과거 날씨 패턴 데이터베이스와 일치하는 시뮬레이션된 날씨 동작을 생성합니다.
이러한 작업 방식에는 몇 가지 어려움이 따릅니다. 모델이 정확한 예측을 하더라도 어떻게 예측하는지 설명하기는 어렵습니다. 또한 모델은 훈련 데이터에 포함되지 않은 시나리오를 예측하지 못하는 경우가 많습니다. 다음 며칠을 예측하도록 훈련된 날씨 모델은 예측을 몇 주 또는 몇 달 후로 추정하는 데 어려움을 겪습니다. 그러나 일부 경우에는(미래 몇 시간 후의 강수량 예측) 머신러닝 방법이 기존 방법보다 성능이 뛰어납니다. 머신러닝 모델에는 실용적인 장점도 있습니다. 이는 더 간단한 기본 코드를 사용하며 덜 전문적인 기상 지식을 가진 과학자가 사용할 수 있습니다.
뇌 모델링의 경우, 이 접근 방식은 현재 데이터 세트의 일부 공백을 채우고 개별 뉴런과 같은 개별 생물학적 구성 요소에 대한 보다 자세한 측정의 필요성을 줄이는 데 도움이 될 수 있습니다. 반면, 보다 포괄적인 데이터 세트를 사용할 수 있게 되면 데이터를 모델에 통합하는 것이 간단해집니다.
이 아이디어를 실현하려면 해결해야 할 몇 가지 과제가 있습니다.
머신 러닝 프로그램은 훈련하고 평가하는 데 사용되는 데이터만큼만 우수합니다. 따라서 신경과학자들은 샘플의 뇌 전체에서 데이터 세트를 얻는 것을 목표로 해야 하며, 이것이 더 실현 가능하다면 몸 전체에서도 데이터 세트를 얻는 것을 목표로 해야 합니다. 뇌의 특정 부분에서 데이터를 수집하는 것이 더 쉽지만 기계 학습을 사용하여 신경망과 같이 고도로 상호 연결된 시스템을 모델링하는 것은 시스템의 많은 부분이 기본 데이터에 존재하지 않는 경우 유용한 정보를 생성할 가능성이 낮습니다.
연구원들은 또한 동일한 샘플의 전체 뇌에서 신경 연결 및 기능 기록(그리고 아마도 미래의 유전자 발현 지도에서)에 대한 해부학적 지도를 얻기 위해 노력해야 합니다. 현재 두 그룹 모두 둘 다보다는 둘 중 하나만 얻는 데 집중하는 경향이 있습니다.
단지 302개의 뉴런만 있으면 C. elegans 신경계에는 연구자들이 한 샘플에서 얻은 연결 맵이 다른 샘플에서도 동일할 것이라고 가정할 수 있을 만큼 충분한 배선이 있을 수 있습니다. 하지만 일부 연구에서는 그렇지 않다고 제안합니다. 그러나 Drosophila melanogaster 및 zebrafish 유충과 같은 더 큰 신경계의 경우 샘플 간의 커넥톰 변형이 중요하므로 뇌 모델은 동일한 샘플에서 얻은 구조적 및 기능적 데이터에 대해 훈련되어야 합니다.
현재 이는 두 가지 일반적인 모델 유기체에서만 가능합니다. C. elegans와 zebrafish 유충의 몸은 투명합니다. 이는 연구자들이 유기체의 전체 뇌에서 기능적 기록을 만들고 개별 뉴런의 활동을 정확히 찾아낼 수 있음을 의미합니다. 이러한 기록 후에 동물을 즉시 죽이고, 수지에 묻고 절단하고, 신경 연결에 대한 해부학적 측정을 수행할 수 있습니다. 그러나 미래에는 연구자들이 고해상도로 신경 활동을 기록하기 위해 초음파를 사용하는 새로운 비침습적 방법을 개발하는 등 결합된 데이터 수집이 가능한 유기체의 범위를 확장할 수 있습니다.
동일한 샘플에서 이러한 다중 모드 데이터 세트를 얻으려면 연구자 간의 광범위한 협력, 대규모 팀 과학에 대한 투자, 보다 포괄적인 노력을 위한 자금 지원 기관의 지원 증가가 필요합니다. 그러나 2016년부터 2021년 사이에 1입방밀리미터의 쥐 뇌에 대한 기능적 및 해부학적 데이터를 얻은 미국 정보 고급 연구 프로그램 활동의 MICrONS 프로젝트와 같은 이러한 접근 방식에 대한 선례가 있습니다.
이 데이터를 얻는 것 외에도 신경과학자들은 주요 모델링 목표와 진행 상황을 측정하기 위한 정량적 측정 기준에 동의해야 합니다. 모델의 목표는 과거 상태를 기반으로 개별 뉴런의 행동을 예측하는 것이어야 할까요, 아니면 전체 뇌를 예측해야 할까요? 단일 뉴런의 활동이 핵심 지표가 되어야 할까요, 아니면 수십만 개의 활성 뉴런에 대한 비율이어야 할까요? 마찬가지로 생물학적 시스템에서 신경 활동을 정확하게 표현하는 것은 무엇입니까? 공식적으로 합의된 벤치마크는 모델링 접근 방식을 비교하고 시간 경과에 따른 진행 상황을 추적하는 데 필수적입니다.
마지막으로, 전산 신경과학자 및 기계 학습 전문가를 포함한 다양한 커뮤니티에 뇌 모델링 문제를 제시하기 위해 연구자들은 더 넓은 과학 커뮤니티에 어떤 모델링 작업이 가장 우선순위인지, 그리고 모델 성능을 평가하는 데 어떤 측정항목을 사용해야 하는지 명확히 해야 합니다. 일기 예보 모델을 평가하고 비교하기 위한 프레임워크를 제공하는 온라인 플랫폼인 WeatherBench는 유용한 템플릿을 제공합니다.
어떤 사람들은 뇌 모델링에 대한 기계 학습 접근 방식이 과학적으로 유용한지 의문을 제기할 것입니다. 물론 그렇습니다. 뇌가 어떻게 작동하는지 이해하려는 문제를 단순히 대규모 인공 네트워크가 작동하는 방식을 이해하려는 문제로 대체할 수 있을까요?
그러나 뇌가 시각과 후각과 같은 감각 자극을 처리하고 인코딩하는 방법을 결정하는 것과 관련된 신경과학 분야에서 유사한 방법을 사용하는 것은 고무적입니다. 연구자들은 일부 생물학적 세부 사항이 지정되는 고전적으로 모델링된 신경망을 기계 학습 시스템과 결합하여 점점 더 많이 사용하고 있습니다. 후자는 이미지 인식과 같은 신경 시스템의 시각 또는 청각 능력을 재현하기 위해 대규모 시각 또는 청각 데이터 세트에 대해 훈련됩니다. 결과 네트워크는 생물학적 네트워크와 놀라운 유사성을 보였지만 실제 신경 네트워크보다 분석하고 조사하기가 더 쉬웠습니다.
지금은 현재 뇌지도 및 기타 작업의 데이터가 생물학적 시스템에서 보이는 것과 일치하는 신경 활동을 재현하도록 기계 학습 모델을 훈련할 수 있는지 묻는 것일 수 있습니다. 여기서는 실패도 재미있을 수 있습니다. 이는 매핑 연구가 더 깊이 있어야 함을 시사합니다.
위 내용은 Google 과학자 Nature 논평: 인공지능이 뇌를 더 잘 이해할 수 있는 방법의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!