>  기사  >  기술 주변기기  >  Li Feifei는 AI가 세상을 진정으로 이해할 수 있도록 기업가적 방향인 '공간 지능'을 해석합니다.

Li Feifei는 AI가 세상을 진정으로 이해할 수 있도록 기업가적 방향인 '공간 지능'을 해석합니다.

WBOY
WBOY원래의
2024-06-01 19:56:001151검색
Li Feifei의 창업을 위한 '공간 지능' 선택, 전체 TED 해석 영상이 공개되었습니다.

Li Feifei는 AI가 세상을 진정으로 이해할 수 있도록 기업가적 방향인 공간 지능을 해석합니다.

얼마 전 로이터는 유명한 "AI 대모" Li Feifei가 스타트업 회사를 만들고 초기 자금 조달을 완료했다고 단독 보도했습니다.

제보자는 스타트업을 소개하면서 밴쿠버에서 열린 Li Feifei의 TED 강연을 인용하여 그가 이 TED 강연에서 공간 지능이라는 개념을 도입했음을 나타냅니다.

오늘, Li Feifei가 TED Vancouver에서 X로 연설한 영상을 공개했습니다. Li Feifei는 AI가 세상을 진정으로 이해할 수 있도록 기업가적 방향인 공간 지능을 해석합니다.그녀가 소개한 통찰이 되려면 통찰이 이해로 바뀌고, 이해가 행동으로 이어집니다. "

Li Feifei는 AI가 세상을 진정으로 이해할 수 있도록 기업가적 방향인 공간 지능을 해석합니다.

Li Feifei TED Talk 링크:

https://www.ted.com/talks/fei_fei_li_with_spatial_intelligence_ai_will_understand_the_real_world /transcript

'공간 지능'의 개념을 더 설명하기 위해 그는 발을 뻗어 테이블 가장자리로 유리잔을 밀고 있는 고양이의 사진을 보여주었습니다. 그는 짧은 순간에 인간의 두뇌는 "이 유리의 기하학적 구조, 3차원 공간에서의 위치, 테이블, 고양이 및 기타 모든 것들과의 관계"를 평가한 다음 무슨 일이 일어날지 예측하고 방지하기 위한 조치를 취하십시오.

Li Feifei는 AI가 세상을 진정으로 이해할 수 있도록 기업가적 방향인 공간 지능을 해석합니다.

“자연은 공간 지능을 기반으로 관찰과 행동의 선순환을 만들어냈습니다.” 그녀는 스탠포드 연구실에서 컴퓨터에게 “3차원 세계에서 행동하는 방법”을 가르치려고 노력하고 있다고 덧붙였습니다. , 대규모 언어 모델을 사용하여 로봇 팔이 구두 지시에 따라 문을 열고 샌드위치를 ​​만드는 등의 작업을 수행할 수 있도록 합니다.

다음은 Li Feifei의 2024 TED 연설 전문입니다:

먼저 보여드리겠습니다. 이곳은 순수하고 끝없는 어둠으로 가득 찬 5억 4천만년 전의 세계입니다. 이 어두움은 빛이 없어서가 아니라 볼 눈이 없어서 나타나는 것입니다. 햇빛이 바다 표면을 관통하여 지하 1,000미터에 도달하고, 열수분출구에서 나오는 빛이 생명이 가득한 해저를 비추고 있지만, 이 고대 바다에는 눈이 하나도 없고, 망막도 없고, 각막도 없고, 수정체도 없습니다. . 그러므로 모든 빛과 모든 생명체는 눈에 보이지 않습니다.

Li Feifei는 AI가 세상을 진정으로 이해할 수 있도록 기업가적 방향인 공간 지능을 해석합니다.

삼엽충이 출현하기 전까지는 '본다'는 개념 자체가 존재하지 않았던 시절이 있었습니다. 삼엽충은 최초로 빛을 감지하여 새로운 세계의 시작을 알린 생물이었습니다. 그들은 처음으로 자신 외에 더 넓은 세상이 있다는 것을 깨닫는다.

이 시각적 능력은 캄브리아기 폭발을 일으켰을 수 있으며, 이로 인해 수많은 동물 종이 화석 기록에 흔적을 남기기 시작했습니다. 빛을 수동적으로 감지하는 것에서 시각을 적극적으로 사용하여 세상을 이해하는 방식으로 생물학적 신경계가 진화하기 시작했고, 시각이 통찰력으로 바뀌고, 유도된 행동이 결국 지능을 만들어냈습니다.

요즘 우리는 더 이상 자연이 주는 시각적 지능에 만족하지 않고, 우리처럼 "볼" 수 있는, 또는 더욱 지능적으로 "볼" 수 있는 기계를 만들고 싶어합니다.

9년 전, 저는 인공 지능의 하위 분야인 컴퓨터 비전의 초기 발전을 소개하기 위해 이 무대에 올랐습니다. 당시 처음으로 신경망 알고리즘, 그래픽 처리 장치(GPU), 빅데이터가 결합되어 현대 인공지능의 새로운 시대를 공동으로 열었습니다. 한 가지 예는 내 연구실에서 수년에 걸쳐 구성한 1,500만 개의 이미지 데이터 세트인 ImageNet 데이터 세트입니다. 우리의 발전은 매우 빨랐고, 알고리즘의 속도와 정확성은 초기 이미지 주석부터 현재까지 크게 향상되었습니다. 우리는 이미지 속 개체를 식별하고 개체 간의 관계를 예측할 수 있는 알고리즘도 개발했습니다. 이 작업은 제 학생들과 협력자들이 수행합니다.

Li Feifei는 AI가 세상을 진정으로 이해할 수 있도록 기업가적 방향인 공간 지능을 해석합니다.

지난번에 제가 자연스러운 인간 언어로 사진을 설명할 수 있는 최초의 컴퓨터 비전 알고리즘을 보여드린 것을 기억해 보세요. 그것은 제가 제 학생인 Andrej Karpathy와 함께 한 작업이었습니다. 그 때 기회를 잡아서 "안드레이, 역방향 컴퓨터를 만들 수 있을까?"라고 말했는데, 안드레이는 "하하, 불가능하다"고 하더군요. 이번 포스팅을 보시면 아시겠지만 이번 건 불가능해졌습니다. . 이는 모두 인간이 제시하는 문장을 완전히 새로운 사진과 비디오로 바꾸는 오늘날의 생성 AI 알고리즘을 지원하는 확산 모델 제품군 덕분입니다.

Li Feifei는 AI가 세상을 진정으로 이해할 수 있도록 기업가적 방향인 공간 지능을 해석합니다.

많은 분들이 OpenAI의 Sora가 만든 놀라운 영상 작품을 목격하셨습니다. 그러나 대규모 GPU 리소스가 없어도 제 학생들과 협력자들은 Sora보다 몇 달 전에 Walt라는 생성 비디오 모델을 성공적으로 개발할 수 있었습니다.

Li Feifei는 AI가 세상을 진정으로 이해할 수 있도록 기업가적 방향인 공간 지능을 해석합니다.

이에도 불구하고 우리는 계속 탐색하고 개선하고 있습니다. 우리는 고양이 눈의 디테일이나 물에 젖지 않고 파도를 헤쳐 나가는 모습 등 결과 영상에 여전히 일부 불완전성이 있음을 발견했습니다. 그러나 과거의 경험이 우리에게 가르쳐 주었듯이, 우리는 이러한 실수로부터 배우고 계속 발전하며 꿈의 미래를 창조할 것입니다. 그 미래에는 AI가 우리를 위해 더 많은 일을 해주거나 우리가 더 나은 일을 할 수 있도록 도와주길 바랍니다.

저는 사진을 찍는 것과 진정으로 "보는 것"과 이해하는 것은 서로 다른 것임을 수년 동안 강조해 왔습니다. 오늘은 뭔가를 추가하고 싶습니다. 단지 보는 것만으로는 충분하지 않습니다. 실제 "보는 것"은 행동과 학습을 위한 것입니다. 공간과 시간의 3차원에서 행동을 취할 때, 우리는 그것을 더 잘 수행하는 방법을 관찰을 통해 배웁니다. 자연은 비전과 행동을 연결하는 '공간지능'을 통해 선순환을 만들어낸다.

Li Feifei는 AI가 세상을 진정으로 이해할 수 있도록 기업가적 방향인 공간 지능을 해석합니다.

공간 지능이 어떻게 작동하는지 설명하려면 이 사진을 보세요. 갑자기 무언가를 하고 싶은 충동이 든다면 이는 두뇌가 유리의 기하학적 구조, 공간에서의 위치, 주변 물체와의 관계를 즉시 분석했다는 의미입니다. 행동하려는 이러한 충동은 공간 지능을 가진 모든 생물에게 내재되어 있으며 인식과 행동을 밀접하게 연결합니다.

Li Feifei는 AI가 세상을 진정으로 이해할 수 있도록 기업가적 방향인 공간 지능을 해석합니다.

인공지능이 현재의 능력을 뛰어넘으려면 보고 말하는 것뿐만 아니라 행동하는 것도 필요합니다. 우리는 이 분야에서 흥미로운 진전을 이루었습니다. 최신 공간 지능의 이정표는 컴퓨터에게 보고, 배우고, 행동하도록 가르치고, 더 잘 보고 행동하는 방법을 지속적으로 배우는 것입니다. 자연이 눈에 의존하여 수신하는 능력을 진화시키는 데 수백만 년이 걸렸기 때문입니다. 2차원 이미지를 빛으로 변환하여 3차원 정보로 변환합니다.

최근에 Google 연구진은 여기에 표시된 예와 같이 일련의 사진을 3차원 공간으로 변환하는 알고리즘을 개발했습니다. 제 학생들과 공동 작업자들은 한 단계 더 나아가 이미지만 입력으로 받아 이를 3차원 모양으로 변환하는 알고리즘을 만들었습니다. 다음은 몇 가지 예입니다.

Li Feifei는 AI가 세상을 진정으로 이해할 수 있도록 기업가적 방향인 공간 지능을 해석합니다.

인간의 언어 설명을 비디오로 변환할 수 있는 컴퓨터 프로그램에 대해 이야기했던 것을 기억하세요. 미시간 대학 연구팀이 문장을 3차원 방 레이아웃으로 변환하는 방법을 발견했습니다. 스탠포드의 동료들과 학생들과 저는 단 하나의 이미지를 가져와 시청자가 탐색할 수 있는 무한한 수의 공간을 만드는 알고리즘을 개발했습니다.

Li Feifei는 AI가 세상을 진정으로 이해할 수 있도록 기업가적 방향인 공간 지능을 해석합니다.

이것은 공간 지능 분야에서 우리가 이룬 흥미로운 진전이자 미래 세계의 가능성을 나타냅니다. 그때쯤 되면 인간은 세상 전체를 현실 세계의 풍부함과 뉘앙스를 시뮬레이션할 수 있는 디지털 세계인 디지털 형태로 변화시킬 수 있게 될 것입니다.

공간 지능의 발전이 가속화되면서 새로운 선순환 시대가 우리 눈앞에 펼쳐지고 있습니다. 이러한 앞뒤 상호 작용은 3차원 세계를 이해하고 상호 작용해야 하는 모든 내장 지능 시스템의 핵심 구성 요소인 로봇 학습을 촉진합니다.

10년 전 제 연구실에서 개발된 ImageNet은 컴퓨터 비전 훈련을 위한 수백만 장의 고품질 사진 데이터베이스를 가능하게 했습니다. 오늘날 우리는 컴퓨터와 로봇이 3차원 세계에서 행동하는 방법을 훈련시키기 위해 행동과 행동의 행동 "ImageNet"을 수집하고 있습니다. 하지만 이번에는 정적 이미지를 수집하는 것이 아니라 3차원 공간 모델을 기반으로 하는 시뮬레이션 환경을 구축하고 있습니다. 이는 컴퓨터에게 행동 방법을 학습할 수 있는 무한한 가능성을 제공합니다.

Li Feifei는 AI가 세상을 진정으로 이해할 수 있도록 기업가적 방향인 공간 지능을 해석합니다.

우리는 로봇 언어 지능 분야에서도 흥미로운 진전을 보이고 있습니다. 대규모 언어 모델을 기반으로 한 입력을 사용하여 제 학생들과 협력자들은 서랍을 열거나 충전 라인에서 전화기를 뽑는 등 음성 명령을 기반으로 다양한 작업을 수행할 수 있는 로봇 팔을 만든 최초의 팀이 되었습니다. 빵, 양상추, 토마토로 샌드위치를 ​​만들고 냅킨도 씌워주세요. 일반적으로 샌드위치에 대한 요구 사항은 로봇 팔보다 더 많겠지만 이는 좋은 시작입니다.

Li Feifei는 AI가 세상을 진정으로 이해할 수 있도록 기업가적 방향인 공간 지능을 해석합니다.

우리 고대, 그 원시 바다에서는 주변 환경을 관찰하고 인지하는 능력이 캄브리아기 생물종의 폭발을 시작했습니다. 오늘날 이 빛은 '디지털 형태의 삶'을 만지고 있습니다. 공간 지능을 통해 기계는 서로뿐만 아니라 인간이나 3차원 세계와도 실제 또는 가상의 형태로 상호 작용할 수 있습니다. 많은 사람들의 삶에 깊은 영향을 미칩니다.

의료 분야를 예로 들어보겠습니다. 지난 10년 동안 제 연구실에서는 인공 지능을 적용하여 환자 치료의 효과에 영향을 미치는 방법과 의료진의 피로 문제를 해결하는 방법을 탐구하는 첫 번째 단계를 밟았습니다.

스탠퍼드 의과대학 및 기타 병원의 협력자들과 함께 스마트 센서를 시험하고 있습니다. 임상의가 손을 제대로 씻지 않은 채 병실에 들어가는 것을 감지하고 수술 기구를 추적하거나 환자가 넘어지는 등의 위험에 처했을 때 의료진에게 경고할 수 있습니다. 이러한 기술은 마치 여분의 눈처럼 세상에 변화를 가져올 수 있는 일종의 주변 지능입니다. 나는 여분의 손이 절실히 필요한 환자, 임상의 및 간병인을 위해 보다 대화형 지원을 선호합니다. 간병인이 환자에게 집중하는 동안 의료 용품을 전달하는 자율 로봇이나 증강 현실을 통해 외과 의사에게 보다 안전하고 빠르며 덜 침습적인 수술을 안내하는 것을 상상해 보세요.

또는 중증 마비 환자가 생각으로 로봇을 제어할 수 있는 시나리오를 상상해 보세요. 그렇습니다. 뇌파를 사용하여 당신과 내가 당연하게 여기는 일상적인 작업을 완료합니다. 내 연구실의 최근 실험에서 이러한 미래의 가능성을 엿볼 수 있습니다. 이 비디오에서 일본 스키야키를 요리하는 로봇 팔은 EEG 캡을 통해 비침습적으로 수집되는 뇌의 전기 신호에 의해 전적으로 제어됩니다.

Li Feifei는 AI가 세상을 진정으로 이해할 수 있도록 기업가적 방향인 공간 지능을 해석합니다.

약 5억년 전, 시각의 출현은 어둠의 세계를 뒤집었고 가장 심오한 진화 과정, 즉 동물 세계의 지능 발달을 촉발시켰습니다. 지난 10년 동안 인공 지능의 놀라운 발전은 똑같이 놀랍습니다. 그러나 나는 한때 자연이 인간에게 그랬던 것처럼 공간 지능으로 구동되는 컴퓨터와 로봇이 있기 전까지는 디지털 캄브리아기 폭발의 잠재력이 완전히 실현되지 않을 것이라고 믿습니다.

우리의 디지털 동반자들이 인간 세계인 아름다운 3차원 공간을 추론하고 상호 작용하는 동시에 우리가 탐험할 수 있는 더 많은 새로운 세계를 창조하는 흥미로운 시간이 될 것입니다. 이러한 미래를 달성하는 것은 쉽지 않을 것입니다. 신중한 생각과 항상 사람을 중심으로 기술을 개발해야 합니다. 그러나 우리가 제대로 해낸다면, 공간 지능을 기반으로 하는 컴퓨터와 로봇은 유용한 도구일 뿐만 아니라 신뢰할 수 있는 파트너가 되어 인간의 생산성을 높이고 조화로운 공존을 촉진할 것입니다. 동시에 우리 개인의 존엄성은 더욱 높아져 인류 사회의 공동 번영으로 이어질 것입니다.

미래에 대해 제가 가장 기대하는 점은 AI가 더욱 예리해지고, 통찰력을 갖고, 공간을 인식하게 될 것이라는 점입니다. 그들은 인간과 함께 걸어갈 것이며, 더 나은 세상을 만들기 위해 끊임없이 더 나은 방법을 추구할 것입니다.

위 내용은 Li Feifei는 AI가 세상을 진정으로 이해할 수 있도록 기업가적 방향인 '공간 지능'을 해석합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.