搜尋
首頁科技週邊人工智慧史丹佛李飛飛首次創業:學術休假兩年,瞄準「空間智能」

「AI 教母」李飛飛創業了。

沒想到,在大模型時代,知名「AI 教母」李飛飛也要「創業」了,完成了種子輪融資。

根據路透社獨家報道,著名電腦科學家李飛飛正在創建一家新創公司。該公司利用類似人類的視覺數據處理方式,使人工智慧能夠進行高階推理。

知情人士透露稱,李飛飛最近為這家公司進行了種子輪融資,投資者包括矽谷創投公司Andreessen Horowitz,以及她去年加入的加拿大公司Radical Ventures。

不過,Andreessen Horowitz 和 Radical Ventures 的發言人都對此保持沉默,李飛飛也未作回應。
史丹佛李飛飛首次創業:學術休假兩年,瞄準「空間智能」
休假兩年

#李飛飛被譽為「人工智慧教母」,此頭銜源自「人工智慧教父」稱號,通常用來致敬三位在電腦科學領域取得卓越成就的拓荒者- 傑弗裡・辛頓(Geoffrey Hinton)、約書亞・本吉奧(Yoshua Bengio)和楊立昆(Yann LeCun)。他們因在 AI 技術方面的突破於 2018 年獲得電腦界的最高獎項圖靈獎。

李飛飛的成名作是開發了一個名為ImageNet 的大規模圖像資料集,該資料集幫助開創了第一代能夠可靠識別物體的電腦視覺技術。李飛飛也是史丹佛大學以人為中心人工智慧研究所(Human-Centered AI Institute)的共同主任。該所專注於以 “改善人類狀況” 的方式發展 AI 技術。除了學術工作外,李飛飛在 2017 年至 2018 年期間領導了谷歌雲端的 AI 部門,擔任 Twitter 董事會成員。

李飛飛曾對人工智慧研究方面存在的資金缺口表示遺憾。她指出,儘管私部門資源豐富,但學術界和政府實驗室的資金支持仍捉襟見肘。她呼籲美國政府拿出「登月思維」,投資這項技術的科學應用及其風險研究。
史丹佛李飛飛首次創業:學術休假兩年,瞄準「空間智能」根據李飛飛的史丹佛履歷顯示,她從 2024 年初到 2025 年底處於「Partial Leave」狀態。她的研究興趣涵蓋了「認知啟發的 AI」、「電腦視覺」和「機器人學習」等領域。
史丹佛李飛飛首次創業:學術休假兩年,瞄準「空間智能」
在職業社交網站領英上,李飛飛將自己的當前工作狀態描述為「新手」和「新事物」,從 2024 年 1 月開始。
史丹佛李飛飛首次創業:學術休假兩年,瞄準「空間智能」
這次創業,李飛飛捲入了最熱門的AI 公司之間的競爭:教導演算法具備常識,以克服當前技術的局限性,如大語言模型可能產生的幻覺。許多人認為,這種「推理」能力必須先建立起來,然後人工智慧模型才能實現通用人工智慧(AGI),即係統能夠像人類一樣或更勝一籌地執行大多數任務。

一些研究人員認為,他們可以透過建立更大、更複雜的模型來提高推理能力,而其他人則認為,未來的道路涉及使用新的“世界模型」,這些模型可以吸收來自周圍物理環境的視覺訊息,以發展邏輯,複製嬰兒的學習方式。

創業方向:空間智慧

#那麼李飛飛具體的創業方向是什麼?

在介紹這家新創公司時,一位消息人士引用了李飛飛上個月在溫哥華 TED 會議上的一次演講。她在演講中表示,該前沿的研究涉及一種可以合理地推斷出圖像和文字在三維環境中的樣子的演算法,並根據這些預測採取行動,這種演算法概念叫做「空間智能」。
史丹佛李飛飛首次創業:學術休假兩年,瞄準「空間智能」
為了進一步解釋「空間智慧」這個概念,她展示了一張貓伸出爪子將玻璃杯推向桌子邊緣的圖片。她表示,在一瞬間,人類大腦可以評估「這個玻璃杯的幾何形狀,它在三維空間中的位置,它與桌子、貓和所有其他東西的關係」,然後預測會發生什麼,並採取行動加以阻止。
史丹佛李飛飛首次創業:學術休假兩年,瞄準「空間智能」

她說:「大自然創造了一個以空間智慧為動力的觀察和行動的良性循環。」她還補充說,她所在的史丹佛大學實驗室正在嘗試教導電腦「如何在三維世界中行動」,例如,使用大型語言模型讓一個機械手臂根據口頭指令執行開門、做三明治等任務。

這讓人聯想到2023年李飛飛公佈的研究VoxPoser以及VIMA 機器人智能體。

VoxPoser將大模型連接到機器人,可在無需額外資料和訓練的情況下,將複雜指令轉化為具體的行動。

史丹佛李飛飛首次創業:學術休假兩年,瞄準「空間智能」

而VIMA 智能體能像GPT-4 一樣接受多模態的(文字、影像、影片或它們的混合)Prompt 輸入,然後輸出動作,完成指定任務。 史丹佛李飛飛首次創業:學術休假兩年,瞄準「空間智能」

我們也可以進一步回顧李飛飛近期的一些其他相關研究。例如,今年1月份,李飛飛在X 上推廣了一篇有關3D 人體渲染工作的新進展—— 一種名為Wild2Avatar 的新模型,該模型即使在有遮擋的情況下仍然能夠完整、高保真地渲染人體。
史丹佛李飛飛首次創業:學術休假兩年,瞄準「空間智能」
在此之前,李飛飛領導的一個多學科聯合團隊也曾發表研究,提出了一種通用型的智慧BRI 系統NOIR( Neural Signal Operated Intelligent Robots / 神經訊號操控的智慧機器人),可以腦控機器人做家事,例如烹飪、熨衣服、玩遊戲等。

史丹佛李飛飛首次創業:學術休假兩年,瞄準「空間智能」

期待李飛飛的創業公司,能為 AI 社群帶來新的驚喜。

以上是史丹佛李飛飛首次創業:學術休假兩年,瞄準「空間智能」的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:机器之心。如有侵權,請聯絡admin@php.cn刪除
使用Pydantic構建結構化研究自動化系統使用Pydantic構建結構化研究自動化系統Apr 24, 2025 am 10:32 AM

在學術研究的動態領域,有效的信息收集,綜合和演示至關重要。 文獻綜述的手動過程是耗時的,阻礙了更深入的分析。 多代理研究助理系統BUI

10 GPT-4O圖像生成會提示今天嘗試!10 GPT-4O圖像生成會提示今天嘗試!Apr 24, 2025 am 10:26 AM

AI世界中發生了絕對野生的事情。 Openai的本地形像生成現在很瘋狂。我們正在談論令人jaw目結舌的視覺效果,可怕的細節和拋光的輸出

用帆板編碼的氛圍指南用帆板編碼的氛圍指南Apr 24, 2025 am 10:25 AM

毫不費力地將您的編碼願景帶入Codeium's Windsurf,這是您的AI驅動的編碼伴侶。 Windsurf簡化了整個軟件開發生命週期,從編碼和調試到優化,將過程轉換為INTU

使用RMGB v2.0探索圖像背景刪除使用RMGB v2.0探索圖像背景刪除Apr 24, 2025 am 10:20 AM

Braiai的RMGB v2.0:強大的開源背景拆卸模型 圖像分割模型正在徹底改變各個領域,而背景刪除是進步的關鍵領域。 Braiai的RMGB v2.0是最先進的開源M

評估大語模型中的毒性評估大語模型中的毒性Apr 24, 2025 am 10:14 AM

本文探討了大語言模型(LLM)中的毒性至關重要問題以及用於評估和減輕它的方法。 LLM,為從聊天機器人到內容生成的各種應用程序提供動力,需要強大的評估指標,機智

Rag Reranker的綜合指南Rag Reranker的綜合指南Apr 24, 2025 am 10:10 AM

檢索增強發電(RAG)系統正在轉換信息訪問,但其有效性取決於檢索到的數據的質量。 這是重讀者變得至關重要的地方 - 充當搜索結果的質量過濾器,以確保僅確保

如何使用Gemma 3&Docling構建多模式抹布?如何使用Gemma 3&Docling構建多模式抹布?Apr 24, 2025 am 10:04 AM

該教程通過在Google Colab中構建精緻的多式聯運檢索一代(RAG)管道來指導您。 我們將使用Gemma 3(用於語言和視覺),文檔(文檔轉換),Langchain等尖端工具

可擴展AI和機器學習應用的射線指南可擴展AI和機器學習應用的射線指南Apr 24, 2025 am 10:01 AM

雷:擴展AI和Python應用程序的有力框架 Ray是一個革命性的開源框架,旨在輕鬆擴展AI和Python應用程序。 它的直觀API使研究人員和開發人員可以通過其代碼過渡

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

SublimeText3 英文版

SublimeText3 英文版

推薦:為Win版本,支援程式碼提示!

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版

WebStorm Mac版

WebStorm Mac版

好用的JavaScript開發工具

mPDF

mPDF

mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),