3 月8 日消息,週一,來自谷歌和柏林工業大學的一組人工智慧研究人員推出了史上最大的視覺語言模型——PaLM-E,參數量高達5620 億(GPT-3 的參數量為1750 億)。
##PaLM-E 是迄今為止已知的最大VLM(視覺語言模型)。作為一種多模態具身 VLM,它不僅可以理解影像,還能理解、生成語言,執行各種複雜的機器人指令而無需重新訓練。它也展示出了強大的湧現能力(模型有不可預測的表現)。
據谷歌稱,當得到一個高級命令,如“把抽屜裡的米片拿給我”,PaLM-E 可以為帶有手臂的移動機器人平台(由谷歌機器人公司開發)生成一個行動計劃,並自行執行這些行動。
PaLM-E 透過分析來自機器人攝影機的資料來實現這一目標,而無需對場景進行預處理。這消除了人類對資料進行預處理或註釋的需要,使機器人控制更加自主。
PaLM-E 還很有彈性,能夠對環境做出反應。例如,PaLM-E 模型可以引導機器人從廚房拿一袋薯片,由於 PaLM-E 整合到了控制迴路中,它對任務中可能發生的中斷有了抵抗力。在一個影片例子中,一名研究人員從機器人手中抓起薯片並移動它們,但機器人找到了薯片並再次抓起它們。
另外,PaLM-E 模型也可控制機器人自主完成原需人類指導的複雜任務。除了機器人技術外,Google研究人員還觀察到使用大型語言模型作為PaLM-E 核心的幾個有趣效果,其中一個是PaLM-E 能表現出“正向轉移”,這意味著將從一個任務中學到的知識和技能轉移到另一個任務中,相較單任務機器人模型能有更好的表現。
Google研究人員計劃未來將探索 PaLM-E 在現實世界中有更多應用,例如家庭自動化或工業機器人,也希望 PaLM-E 能夠激發更多關於多模態 AI 的應用。
IT之家曾報道,身為GoogleAI 勁敵的微軟近期也發表了「ChatGPT for Robotics」的論文,以類似的方式結合視覺數據和大型語言模型來控制機器人。
以上是5620 億參數!谷歌發布史上最大「通才」AI 模型 PaLM-E,可讓機器人自主執行多種任務的詳細內容。更多資訊請關注PHP中文網其他相關文章!

軟AI(被定義為AI系統,旨在使用近似推理,模式識別和靈活的決策執行特定的狹窄任務 - 試圖通過擁抱歧義來模仿類似人類的思維。 但是這對業務意味著什麼

答案很明確 - 只是雲計算需要向雲本地安全工具轉變,AI需要專門為AI獨特需求而設計的新型安全解決方案。 雲計算和安全課程的興起 在

企業家,並使用AI和Generative AI來改善其業務。同時,重要的是要記住生成的AI,就像所有技術一樣,都是一個放大器 - 使得偉大和平庸,更糟。嚴格的2024研究O

解鎖嵌入模型的力量:深入研究安德魯·NG的新課程 想像一個未來,機器可以完全準確地理解和回答您的問題。 這不是科幻小說;多虧了AI的進步,它已成為R

大型語言模型(LLM)和不可避免的幻覺問題 您可能使用了諸如Chatgpt,Claude和Gemini之類的AI模型。 這些都是大型語言模型(LLM)的示例,在大規模文本數據集上訓練的功能強大的AI系統

最近的研究表明,根據行業和搜索類型,AI概述可能導致有機交通下降15-64%。這種根本性的變化導致營銷人員重新考慮其在數字可見性方面的整個策略。 新的

埃隆大學(Elon University)想像的數字未來中心的最新報告對近300名全球技術專家進行了調查。由此產生的報告“ 2035年成為人類”,得出的結論是,大多數人擔心AI系統加深的採用


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

VSCode Windows 64位元 下載
微軟推出的免費、功能強大的一款IDE編輯器

SublimeText3漢化版
中文版,非常好用

Dreamweaver Mac版
視覺化網頁開發工具

mPDF
mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

Atom編輯器mac版下載
最受歡迎的的開源編輯器