호그와트의 마법이 없어도 다른 사람들이 어떻게 생각하는지 볼 수 있습니다!
방법은 매우 간단하며 Stable Diffusion을 기반으로 뇌 이미지를 시각화합니다.
예를 들어 여러분이 보는 곰, 비행기, 기차는 이렇게 생겼어요.
AI가 뇌 신호를 볼 때 생성되는 이미지는 다음과 같으며 필요한 모든 지점이 있음을 보여줍니다.
이 AI 두뇌 판독 기술은 CVPR 2023에서 막 승인되어 팬들에게 즉각적인 "두개내 오르가즘"을 선사합니다.
정말 거칠어요! 프로젝트를 유도하는 것은 잊어버리세요. 이제 두뇌를 사용하여 해당 사진에 대해 "생각"하면 됩니다.
fMRI 데이터에서 시각적 이미지를 재구성하기 위해 Stable Diffusion을 사용한다고 상상해보세요. 이는 미래에 비침습적 뇌-컴퓨터 인터페이스의 개발을 의미할 수 있습니다.
AI가 인간의 언어를 직접 건너뛰고 인간의 두뇌에서 생각하는 것을 인식하게 하세요.
그때쯤이면 Musk가 개발한 Neuralink도 이 AI 천장을 따라잡을 것입니다.
세밀하게 조정할 필요 없이 AI를 사용하여 생각하는 내용을 직접 재현합니다
그렇다면 AI는 어떻게 뇌 읽기를 실현할까요?
최신 연구는 일본 오사카 대학 연구팀의 연구 결과입니다. ㅋㅋㅋ CT 연구진은 잠재적인 확산 가능성을 기반으로 보다 구체적으로는 Stable Diffusion을 통해 fMRI 데이터로부터 시각적 경험을 재구성하는 모델(LDM)입니다.
전체 작업 프로세스의 프레임워크도 매우 간단합니다. 이미지 인코더 1개, 이미지 디코더 1개, 의미 체계 디코더 1개입니다.
이를 통해 팀에서는 복잡한 AI 모델을 훈련하고 미세 조정할 필요가 없어졌습니다.
훈련해야 하는 것은 하부 및 상부 시각 뇌 영역의 fMRI 신호를 단일 안정 확산 구성요소에 매핑하는 간단한 선형 모델뿐입니다.
구체적으로 연구원들은 뇌 영역을 이미지 및 텍스트 인코더에 대한 입력으로 매핑했습니다. 하위 뇌 영역은 이미지 인코더에 매핑되고 상위 뇌 영역은 텍스트 인코더에 매핑됩니다. 이를 통해 시스템은 재구성을 위해 이미지 구성 및 의미론적 콘텐츠를 사용할 수 있습니다.
연구원들은 각각 초기 및 상위 수준 시각 피질의 fMRI 신호에서 재구성된 이미지 z와 관련 텍스트 c의 잠재 표현을 디코딩하고 이를 입력으로 사용하여 오토인코더에 의해 재현된 이미지 Xzc를 생성했습니다.
그런 다음 연구원들은 LDM의 내부 작동 메커니즘을 탐색하기 위해 LDM의 다양한 구성 요소에서 fMRI 신호를 예측하는 코딩 모델을 구축했습니다.
연구원들은 NSD(Natural Scenes Dataset)의 fMRI 이미지를 사용하여 실험을 수행하고 Stable Diffusion을 사용하여 피험자가 본 것을 재구성할 수 있는지 테스트했습니다.
코딩 모델과 LDM 관련 잠상 예측 정확도를 볼 수 있는데, 마지막 모델이 뇌 뒤쪽의 시각 피질에서 가장 높은 예측 정확도를 생성합니다.
주체의 시각적 재구성 결과는 z로만 재구성된 이미지가 원본 이미지와 시각적으로 일치하지만 의미적 내용을 포착할 수 없음을 보여줍니다.
c만을 사용하여 재구성한 이미지는 의미 충실도가 더 좋지만 시각적 일관성이 좋지 않은 반면, zc를 사용하여 재구성한 이미지는 높은 의미 충실도와 고해상도를 모두 가질 수 있습니다.
모든 피사체의 동일한 이미지에 대한 재구성 결과는 서로 다른 피사체 간에 재구성 효과가 안정적이고 비교적 정확하다는 것을 보여줍니다.
구체적인 세부 사항의 차이는 재구성 과정의 오류보다는 개인마다 느끼는 지각 경험이나 데이터 품질의 차이에서 비롯될 수 있습니다.
마지막으로 정량평가 결과를 그래프로 나타내었습니다.
다양한 결과를 통해 연구에 사용된 방법은 낮은 수준의 시각적 외양을 포착할 수 있을 뿐만 아니라 원래 자극의 높은 수준의 의미적 내용도 포착할 수 있음을 보여줍니다.
이러한 관점에서 실험은 이미지와 텍스트 디코딩의 조합이 정확한 재구성을 제공한다는 것을 보여줍니다.
연구자들은 피험자 간 정확도에 차이가 있지만 이러한 차이는 fMRI 영상의 품질과 관련이 있다고 말했습니다. 팀에 따르면 재구성의 품질은 현재 SOTA 방법과 비슷하지만 여기에 사용되는 AI 모델의 교육이 필요하지 않습니다.
동시에 팀은 fMRI 데이터에서 파생된 모델을 사용하여 역확산 과정에서 의미 콘텐츠가 어떻게 생성되는지, U-Net 과정에서 어떤 일이 발생하는지 등 Stable Diffusion의 개별 빌딩 블록을 연구하고 있습니다. .
잡음 제거 과정의 초기 단계에서는 U-Net의 병목 계층(주황색)이 가장 높은 예측 성능을 발휘하며, 잡음 제거 과정이 진행됨에 따라 초기 레이어(파란색)는 초기 시각 피질 활동에 대한 예측을 수행하며, 병목층은 높은 수준의 시각 피질로 변합니다.
이는 확산 과정 초기에 이미지 정보가 병목 레이어에서 압축되고 노이즈 제거를 통해 시각 피질에 U-Net 레이어 간의 분리가 나타난다는 것을 의미합니다.
또한 팀은 다양한 확산 단계에서 이미지 변형에 대한 정량적 설명을 위해 노력하고 있습니다. 이러한 방식으로 연구자들은 널리 사용되지만 이해가 아직 제한적인 확산 모델을 생물학적 관점에서 더 잘 이해하는 데 기여하는 것을 목표로 합니다.
인간의 뇌 이미지는 이미 AI로 해독되었다고요?
수년 동안 연구자들은 인공 지능 모델을 사용하여 인간 두뇌의 정보를 해독해 왔습니다.
대부분의 방법의 핵심은 미리 녹음된 fMRI 이미지를 텍스트 또는 이미지의 생성 AI 모델에 대한 입력으로 사용하는 것입니다.
예를 들어, 2018년 초 일본 연구진은 신경망이 fMRI 녹음에서 이미지를 재구성할 수 있는 방법을 시연했습니다.
2019년 한 그룹이 원숭이 뉴런의 이미지를 재구성했고, Jean-Remi King이 이끄는 Meta의 연구 그룹은 fMRI 데이터에서 텍스트를 파생하는 등 새로운 연구를 발표했습니다.
2022년 10월, 오스틴에 있는 텍사스 대학교 팀은 GPT 모델이 fMRI 스캔에서 사람이 비디오에서 보는 내용의 의미론적 내용을 설명하는 텍스트를 추론할 수 있음을 보여주었습니다.
2022년 11월 싱가포르 국립 대학교, 홍콩 중문 대학교, 스탠포드 대학교의 연구원들은 MinD-Vis 확산 모델을 사용하여 당시 사용 가능한 방법보다 훨씬 더 높은 정확도로 fMRI 스캔의 이미지를 재구성했습니다.
일부 네티즌들은 "뇌파를 기반으로 이미지를 생성하는 것은 적어도 2008년부터 있었는데, 어쩐지 Stable Diffusion이 사람의 생각을 읽을 수 있다는 것을 암시한다. 정말 말도 안 된다. ”
캘리포니아 버클리 대학이 Nature에 발표한 이 논문에서는 인간의 뇌파 활동이 시각적 디코더를 사용하여 이미지로 변환될 수 있다고 명시하고 있습니다.
일부 사람들은 역사를 추적하기 위해 대뇌 피질의 이미지를 재구성하는 Stanford Li Feifei의 1999년 연구를 직접 인용했습니다.
Li Feifei도 당시 자신이 아직 대학 인턴이었다고 댓글을 달고 전달했습니다.
또한 2011년에 UC Berkeley 연구에서는 기능적 자기 공명 영상(fMRI)과 컴퓨터 모델을 사용하여 뇌의 "동적 시각적 이미지"를 처음으로 재구성했습니다.
즉, 사람들이 본 클립을 재현한 것입니다.
그러나 최신 연구와 비교하면 이 재구성은 전혀 "고화질"이 아니며 거의 알아볼 수 없습니다.
저자 소개
다카기 유
다카기 유는 오사카대학교의 조교수입니다. 그의 연구 관심분야는 컴퓨터 신경과학과 인공지능의 교차점에 있습니다.
박사 과정 동안 ATR 뇌정보통신연구소에서 기능적 자기공명영상(fMRI)을 활용해 전뇌 기능 연결성으로 다양한 개인차를 예측하는 기술을 연구했다.
최근 그는 옥스퍼드 대학교 인간 두뇌 활동 센터와 도쿄 대학교 심리학과에서 복잡한 의사 결정 작업에서 동적 계산을 이해하기 위해 기계 학습 기술을 사용했습니다.
니시모토 신지
니시모토 신지는 오사카대학교 교수입니다. 그의 연구는 뇌의 시각 및 인지 처리에 대한 정량적 이해에 중점을 두고 있습니다.
더 구체적으로 니시모토 교수 팀의 연구 초점은 자연스러운 지각 및 인지 조건에서 유발되는 뇌 활동의 예측 모델을 구축하여 신경 처리 및 표현을 이해하는 것입니다.
일부 네티즌들은 저자에게 이 연구가 꿈을 해석하는 데 사용될 수 있는지 물었습니다.
"수면 중 뇌 활동에도 동일한 기술을 적용하는 것이 가능하지만 현재 이러한 적용의 정확성은 불분명합니다."
이 연구를 본 후: 이제 Photo Legilimency를 사용할 수 있습니다. .
참조:
https://www.php.cn/link/0424d20160a6a558e5bf86a7bc9b67f0
https://www . php.cn/link/02d72b702eed900577b953ef7a9c1182
위 내용은 AI 독서 뇌가 폭발한다! 뇌 이미지 스캔 및 Stable Diffusion으로 이미지를 사실적으로 재현의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

젬마 범위로 언어 모델의 내부 작업 탐색 AI 언어 모델의 복잡성을 이해하는 것은 중요한 도전입니다. 포괄적 인 툴킷 인 Gemma Scope의 Google 릴리스는 연구원에게 강력한 강력한 방법을 제공합니다.

비즈니스 성공 잠금 해제 : 비즈니스 인텔리전스 분석가가되는 가이드 원시 데이터를 조직의 성장을 이끌어내는 실행 가능한 통찰력으로 바꾸는 것을 상상해보십시오. 이것은 비즈니스 인텔리전스 (BI) 분석가의 힘 - GU에서 중요한 역할입니다.

SQL의 Alter Table 문 : 데이터베이스에 열을 동적으로 추가 데이터 관리에서 SQL의 적응성이 중요합니다. 데이터베이스 구조를 즉시 조정해야합니까? Alter Table 문은 솔루션입니다. 이 안내서는 Colu를 추가합니다

소개 두 전문가가 중요한 프로젝트에 대해 협력하는 번화 한 사무실을 상상해보십시오. 비즈니스 분석가는 회사의 목표, 개선 영역을 식별하며 시장 동향과의 전략적 조정을 보장합니다. 시무

Excel 데이터 계산 및 분석 : 카운트 및 카운트 기능에 대한 자세한 설명 정확한 데이터 계산 및 분석은 특히 큰 데이터 세트로 작업 할 때 Excel에서 중요합니다. Excel은이를 달성하기위한 다양한 기능을 제공하며, 카운트 및 카운타 기능은 다른 조건에서 셀 수를 계산하기위한 핵심 도구입니다. 두 기능 모두 셀을 계산하는 데 사용되지만 설계 목표는 다른 데이터 유형을 대상으로합니다. Count 및 Counta 기능의 특정 세부 사항을 파고 고유 한 기능과 차이점을 강조하고 데이터 분석에 적용하는 방법을 배우겠습니다. 핵심 포인트 개요 수를 이해하고 쿠션하십시오

Chrome 's AI Revolution : 개인화되고 효율적인 탐색 경험 인공 지능 (AI)은 우리의 일상 생활을 빠르게 변화시키고 있으며 Chrome은 웹 브라우징 경기장에서 요금을 주도하고 있습니다. 이 기사는 흥분을 탐구합니다

재구성 영향 : 4 배의 결론 너무 오랫동안 대화는 AI의 영향에 대한 좁은 견해로 인해 주로 이익의 결론에 중점을 두었습니다. 그러나보다 전체적인 접근 방식은 BU의 상호 연결성을 인식합니다.

상황이 그 시점을 꾸준히 움직이고 있습니다. 양자 서비스 제공 업체와 신생 기업에 쏟아지는 투자는 업계의 중요성을 이해하고 있음을 보여줍니다. 그리고 점점 더 많은 실제 사용 사례가 그 가치를 보여주기 위해 떠오르고 있습니다.


핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

MinGW - Windows용 미니멀리스트 GNU
이 프로젝트는 osdn.net/projects/mingw로 마이그레이션되는 중입니다. 계속해서 그곳에서 우리를 팔로우할 수 있습니다. MinGW: GCC(GNU Compiler Collection)의 기본 Windows 포트로, 기본 Windows 애플리케이션을 구축하기 위한 무료 배포 가능 가져오기 라이브러리 및 헤더 파일로 C99 기능을 지원하는 MSVC 런타임에 대한 확장이 포함되어 있습니다. 모든 MinGW 소프트웨어는 64비트 Windows 플랫폼에서 실행될 수 있습니다.

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

WebStorm Mac 버전
유용한 JavaScript 개발 도구

Dreamweaver Mac版
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)
