搜索
首页科技周边人工智能AIGC+机器人=具身智能?硅谷最酷的两个男人不谋而合 A股预演“下个浪潮”

新的AI题材层出不穷,这次轮到“机器人+AI”融合而成的具身智能概念。

“硅谷钢铁侠”马斯克和热爱黑色皮衣的“显卡教父”黄仁勋均作出积极表态,可谓不谋而合。

当地时间5月16日, 特斯拉2023年年度股东大会召开,马斯克在会上表示,人形机器人将会是今后特斯拉主要的长期价值来源,“如果人形机器人和人的比例是2比1左右,那么人们对机器人的需求量可能是100亿乃至200亿个,远超电动车的数量。”

同日,英伟达创始人兼首席执行官黄仁勋在ITF World 2023半导体大会上表示,AI下一个浪潮将是“具身智能”,他也公布了Nvidia VIMA,这是一个多模态具身人工智能系统,能够在视觉文本提示的指导下执行复杂的任务。

反映在A股二级市场上,今日,相关标的强势上涨,多只个股涨停。截至收盘,鸣志电器、优德精密、奥比中光涨停,机器人、虹软科技、云天励飞、昊志机电、埃夫特等涨超10%。

马斯克自2021年一直强调其人形机器人的潜力,坚定不移地提出“机器人+人工智能”的广阔前景。而在AIGC(生成式AI)火热的当下,“具身智能”这一名词的普及正逢其时,将“机器人+AI”再次推上舞台中心。

AIGC、具身智能、机器人,三者到底是如何联系在一起的?

特斯拉人形机器人≈具身智能机器人

人们对马斯克的人形机器人早已耳熟能详。从最终用途来看,特斯拉人形机器人和具身智能机器人几乎可以划等号

马斯克对特斯拉机器人的远景目标是让机器人适应环境并能做人类所做之事,进而让其服务于千家万户,比如做饭、修剪草坪、照顾老人等。

具身智能机器人是一个具有物理实体、可与真实世界进行多模态交互,像人类一样感知和理解环境,并通过自主学习完成任务的智能体。英伟达机器人研究高级主管、华盛顿大学教授 Dieter Fox 此前指出,机器人研究的一个关键目标是构建在现实世界中对人类有帮助的机器人。

AIGC为具身智能突破技术瓶颈提供新思路

具身智能是智能科学的一个基础问题,也是一个大难题。而AIGC为具身智能的实现提供了新思路。

1950 年,图灵在他的论文——《Computing Machinery and Intelligence》中首次提出了具身智能的概念。在未来数十年内,由于技术问题的制约,物理智能并没有取得很大的发展进展。

正如斯坦福大学计算机科学教授李飞飞所说,“具身的含义不是身体本身,而是与环境交互以及在环境中做事的整体需求和功能。”

与人、与环境的交互,是具身智能机器人形成对于客观世界的理解和改造能力的第一步,这方面,最直接的障碍在于,人们严重依赖手写代码来控制机器人,人类与人工智能面前,“巴别塔”高筑。

而进入AIGC时代,GPT等AI大模型提供了新的解决方案,已有不少研究者尝试将多模态的大语言模型作为人类与机器人沟通的桥梁。即通过将图像、文字、具身数据联合训练,并引入多模态输入,增强模型对现实中对象的理解,帮助机器人处理具身推理任务。

微软、谷歌、阿里等积极探索

目前,具身智能已经成为国际学术前沿研究方向,包括美国国家科学基金会在内的机构都在推动具身智能的发展,各大国际学术会议也开始越来越多地关注具身智能相关工作,美国顶尖高校已经开始形成具身智能研究社区。

业界同样进展神速,谷歌、微软带头,均试图以大模型为机器人注入灵魂。前者的PaLM-E模型与具身智能密不可分,完成机器人具身任务一直是该模型研究的重点,后者正探索如何将 OpenA研发的ChatGPT扩展到机器人领域,从而让我们用语言直观控制如机械臂、无人机、家庭辅助机器人等多个平台。

国内,阿里巴巴也正在试验将千问大模型接入工业机器人,在钉钉对话框输入一句人类语言,可远程指挥机器人工作。

投资主线日益清晰

从技术上看,具身智能的实现离不开三大环节——感知、想象和执行。具体而言,要想实现具身智能机器人,需要其具备灵活的思维、强大的执行能力、出色的与人交流能力和类人的自我学习能力。

强大的执行力依赖于机器人的物理外设,即机械身体和基本运动控制,感知、想象能力可以外化为机器人能听、能看、能说,需要利用机器视觉、深度学习、强化学习等多种AI技术优化软件与算法,并利用文本、视觉、语音、场景等跨越不同环境的大量数据集进行训练。

多家机构认为,机器人产业、多模态大模型、以及机器视觉技术等是新的赚钱方向。国盛证券称,多模态GPT能极大助力机器人产业的发展,未来5-10年,结合复杂多模态方案的大模型有望具备完备的与世界交互的能力,在通用机器人等领域得到应用;天风国际证券表示,AI是机器视觉的母身,深度学习为机器视觉的技术堡垒,近期Meta发布SAM模式有望助力机器视觉迎来GPT时刻。

身处上述行业或拥有相应技术的公司已成重点关注对象。上市公司互动易上,凌云光、汇川技术、海天瑞声等均被投资者追问与具身智能的联系。其中,凌云光是为数不多的给出明确回应的公司,称其采用多模态融合技术解决客户多场景的智能制造需求,属于向具身智能方向发展的必经环节

结合机构研报,据《科创板日报》不完全梳理,还有这些公司均受到关注:

AIGC+机器人=具身智能?硅谷最酷的两个男人不谋而合 A股预演“下个浪潮”

来源:科创板日报

以上是AIGC+机器人=具身智能?硅谷最酷的两个男人不谋而合 A股预演“下个浪潮”的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文转载于:搜狐。如有侵权,请联系admin@php.cn删除
10 GPT-4O图像生成会提示今天尝试!10 GPT-4O图像生成会提示今天尝试!Apr 24, 2025 am 10:26 AM

AI世界中发生了绝对野生的事情。 Openai的本地形象生成现在很疯狂。我们正在谈论令人jaw目结舌的视觉效果,可怕的细节和抛光的输出

用帆板编码的氛围指南用帆板编码的氛围指南Apr 24, 2025 am 10:25 AM

毫不费力地将您的编码愿景带入Codeium's Windsurf,这是您的AI驱动的编码伴侣。 Windsurf简化了整个软件开发生命周期,从编码和调试到优化,将过程转换为INTU

使用RMGB v2.0探索图像背景删除使用RMGB v2.0探索图像背景删除Apr 24, 2025 am 10:20 AM

Braiai的RMGB v2.0:强大的开源背景拆卸模型 图像分割模型正在彻底改变各个领域,而背景删除是进步的关键领域。 Braiai的RMGB v2.0是最先进的开源M

评估大语模型中的毒性评估大语模型中的毒性Apr 24, 2025 am 10:14 AM

本文探讨了大语言模型(LLM)中的毒性至关重要问题以及用于评估和减轻它的方法。 LLM,为从聊天机器人到内容生成的各种应用程序提供动力,需要强大的评估指标,机智

Rag Reranker的综合指南Rag Reranker的综合指南Apr 24, 2025 am 10:10 AM

检索增强发电(RAG)系统正在改变信息访问,但其有效性取决于检索到的数据的质量。 这是重读者变得至关重要的地方 - 充当搜索结果的质量过滤器,以确保仅确保

如何使用Gemma 3&Docling构建多模式抹布?如何使用Gemma 3&Docling构建多模式抹布?Apr 24, 2025 am 10:04 AM

该教程通过在Google Colab中构建精致的多式联运检索一代(RAG)管道来指导您。 我们将使用Gemma 3(用于语言和视觉),文档(文档转换),Langchain等尖端工具

可扩展AI和机器学习应用的射线指南可扩展AI和机器学习应用的射线指南Apr 24, 2025 am 10:01 AM

雷:扩展AI和Python应用程序的有力框架 Ray是一个革命性的开源框架,旨在轻松扩展AI和Python应用程序。 它的直观API使研究人员和开发人员可以通过其代码过渡

如何将OpenAI MCP集成用于建筑代理?如何将OpenAI MCP集成用于建筑代理?Apr 24, 2025 am 09:58 AM

OpenAI通过支持人类的模型上下文协议(MCP)来涵盖互操作性,这是一种开源标准,简化了与不同数据系统的AI助手集成。这项合作为AI应用程序奠定了一个统一的框架

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

Video Face Swap

Video Face Swap

使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热工具

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

SublimeText3 英文版

SublimeText3 英文版

推荐:为Win版本,支持代码提示!

SublimeText3 Linux新版

SublimeText3 Linux新版

SublimeText3 Linux最新版

WebStorm Mac版

WebStorm Mac版

好用的JavaScript开发工具

mPDF

mPDF

mPDF是一个PHP库,可以从UTF-8编码的HTML生成PDF文件。原作者Ian Back编写mPDF以从他的网站上“即时”输出PDF文件,并处理不同的语言。与原始脚本如HTML2FPDF相比,它的速度较慢,并且在使用Unicode字体时生成的文件较大,但支持CSS样式等,并进行了大量增强。支持几乎所有语言,包括RTL(阿拉伯语和希伯来语)和CJK(中日韩)。支持嵌套的块级元素(如P、DIV),