搜索
首页科技周边人工智能天眼新知 | 机器人从未来而来 与大模型碰撞出“智慧”的火花

前言:随着中国数字经济的深入发展,产业数字化进程不断加速,大数据在产业决策中的比重越来越高。天眼查数据研究院特此推出“天眼新知”专栏,以天眼查大数据为依托,梳理产业格局及发展脉络,解读产业领域最新动态和投融资风向,为各方决策提供参考。

本文为天眼新知·产业分析系列,第三十七篇。

机器人,多数人的第一次“亲密接触”源于科幻大电影,源于对超越现实生活的无尽想象,机器人逐渐从“工具”逐步进化成为“亲密伙伴”。

年初爆红的“大模型”,以及再次“走红”的人形机器人,让人们再次惊呼科技对于生活方式的改变。

未来,随着AI技术的不断成熟,人形机器人研发的突破,让“机器人走进普通人生活的愿景”越来越逼近现实。

一、机器人:从“自动化”向“智能化”演进

国际机器人协会(InternationalFederationofRobotics,IFR)提出,机器人是可在两个或多个轴上进行编程的驱动机制,具有一定程度的自主性,在特定环境中移动以执行预定的任务。

1.机器人应用场景逐步由“简单,初级”向“复杂,高级”迈进

最初机器人的核心功能是替代人进行重复的、危险的工作,同时提高效率与精度;之后以“服务人”为功能的机器人走入人们的眼帘,用于迎宾接待等与人类距离更近的场景,娱乐/扫地机器人等大规模进入家庭;接着其高精度的特性被用于物流、医疗,自动取件、辅助护理机器人开始出现。

2.机器人逐步由“自动化”向“智能化”演进

机器人的发展经历了三代的演进,第一代为程序控制机器人:通过编程或示教将动作指令输入机器人中,而由于缺之外部传感器,机器人只能刻板地完成程序规定的动作,一旦环境情况略有变化,机器人的工作就会出现问题;第二代为自适应机器人:其带有视觉、力觉等传感器,能据传感器获得的信息调整工作状态:第三代为智能机器人:其拥有更丰富的传感器,不仅能获取并处理外部综合信息,甚至能据此自己制定行动目标,其智能主要体现在感知交互、独立决策、自我优化三个方面。

二、大模型:一线城市率先发力,主攻通用人工智能

2023年4月中共中央政治局会议指出,要重视通用人工智能发展,营造创新生态,重视防范风险。区别于此前中央经济工作会议等重要会议中泛指的“人工智能”,此次政治局会议明确强调“通用”,即Chat-GPT自去年11月以来引领的通用性AI大模型技术路线。

天眼新知 | 机器人从未来而来 与大模型碰撞出“智慧”的火花

北京市《若干措施》的发布是国内首个地方政府紧贴AI大模型产业化发展提出的专项措施,北京打响了地方大模型竞赛的第一枪。当前Chat-GPT引发的“千模大战”已经开始,大模型有可能为不同行业带来全新的效率革命和体验提升。随着AI第一城北京行动了,上海、深圳、杭州等地区可能也会陆续采取行动。

三、人形机器人:人与机器的“不期而遇”

人形机器人是一种智能机器人,其外观和运动方式与人类相似,其定义和使用目的也如同人类一般。人形机器人(humanoidrobots)又译“仿人机器人”,字面意思是模仿人的形态和行为设计制造的机器人。目前人形机器人并没有普遍定义,但根据专业书籍《HumanoidRobots》的归纳,人形机器人应当能“在人工作和居住的环境工作,操作为人设计的工具和设备,与人交流”。在此前提下,人形机器人最终应具有与人类似的身体结构,包括头、躯干和四肢,使用双足行走,用多指手执行各种操作,并具有一定程度的认知和决策智能。

人形机器人起步于1960年代后期,以日本的研究成果最为瞩目。1973年日本早稻田大学的加藤一郎教授研发出世界上第一款人形机器人WABOT-1的WL-5号两足步行机,严格讲类属于仿生机械,是人形机器人的雏形。Honda began researching humanoid robot ASIMO in 1986 and successfully released the first prototype in 2000.。

天眼新知 | 机器人从未来而来 与大模型碰撞出“智慧”的火花

四、人形机器人与AI大模型:通用场景加速C端革命性推进

随着集成设计技术、运动管理控制技术、传感器感知技术等关键技术的不断突破,以及人工智能、5G等新一代信息技术的融合应用持续深入,特种机器人加速应用于煤矿、深海、极地等场景,释放出巨大的生产和科研价值,而其中最让前沿科技公司、普通消费者“着迷”的是以人形机器人为代表的智能移动机器人的出现,迭代。

目前,AI技术通过构建全面感知、实时互联、分析决策、自主学习的智能系统,使机器人自主作业成为可能。AI通过机器人视觉技术强化机器人的感知能力,通过构建算法模型提升其分析决策、自主学习的能力,从而使机器人能够独立完成作业。

1.感知世界的能力(机器人的眼睛)

机器人自主移动的感知和定位技术中激光和视觉导航是主流应用方案。计算机视觉的发展经历了基于以特征描述子代表的传统视觉方法、以CNN卷积神经网络为代表的深度学习技术,目前通用的视觉大模型正处于研究探索阶段,人形机器人的场景相对工业机器人更通用、更复杂,视觉大模型的AllinOne的多任务训练方案能使得机器人更好地适应人类生活场景。

一方面,大模型的强拟合能力使得人形机器人在进行目标识别、避障、三维重建、语义分割等任务时具备更高的精确度;另一方面,大模型解决了深度学习技术过分依赖单一任务数据分布,场景泛化效果不佳的问题,通用视觉大模型通过大量数据学到更多的通用知识,并迁移到下游任务中,基于海量数据获得的预训练模型具有较好的知识完备性,提升场景泛化效果。

典型产品:特斯拉“Optimus(擎天柱)”

感知层面,特斯拉机器人头部使用8个摄像头采集视觉信息。计算层面,机器人将采用目前特斯拉汽车使用的FSD(FullSelf-Driving,全自动驾驶)电脑、运用神经网络等模型实时处理信息。特斯拉计划利用超级计算机“Dojo”对机器人所使用的人工智能模型进行训练,以提高其识别外界物体和作出反应的效率。

2.思考和决策的能力(机器人的大脑)

目前的机器人都是专用机器人,只能在限定场景中应用,即使是机器人抓取,基于计算机视觉,仍然是在限定场景中,算法仅用于识别物体,如何做、做什么仍需要人的定义。要让机器人通用,叫他去浇花,他就知道去拿水壶,接水,然后浇花,这是需要常识才能完成的事情。在大规模模型问世之前,让机器人具备常识几乎是不可能的。大模型让机器人可以拥有常识,从而具备通用性去完成各种任务,彻底改变通用机器人实现的模式。人类工具和环境的适应性,不用再为了机器人而造工具。

典型产品:首个机器人公民“索菲亚”

2017年,索菲亚成为世界上第一个获得公民身份的机器人。她说她会用她的智慧帮助人类发展,让我们不要害怕她,她很友善。2018年,她还成为全球首位开展在线教育课程的AI老师。索菲亚表示,未来的机器人完全胜任教师的工作,能够基于与学生的互动,有效解决学生遇到的心理和情感问题。

3.执行能力(机器人的四肢)

行动能力(腿)+精细操作(手)。把机器人做成人形,就是为了让机器人的执行能力更加通用。机器人执行任务时所处的环境是按照人类的体型建造起来的:建筑、道路、设施、工具等,这个世界是为了方便人类这种人形生物才这样设计。人们必须重新设计一套适合新型机器人的环境,以应对其出现。设计在某个特定范围内执行任务的机器人相对容易,如果想要提高机器人的通用性,就必须选择可以作为分身的人形机器人。此外,与人类相比,人形机器人更易于在情感上进行交流,因为它们能够让人感到亲近。

典型产品:波士顿动力Atlas

2020年12月,波士顿动力发布了Atlas跳舞的视频,动作流畅且富有表现力。机器人必须在起跳悬空状态下调整姿势,以保持平衡并精准完成舞蹈动作。2021年8月,在官方最新视频中,Atlas可以在障碍环境内“跑酷”,做出跳跃、俯冲翻滚、空翻等一系列高难度全身动作。

4.“具身智能”+机器人:人工智能的终极形态

“具身智能”的概念源于如何让电脑拥有类似一岁小孩的感知和行动能力的问题。其可以简单理解为,各种不同形态的机器人,让它们在真实的物理环境下执行各种各样的任务,来完成人工智能的进化过程,比如:人形机器人、智能驾驶汽车,或者未来的“变形金刚”。

英伟达创始人黄仁勋在ITFWorld2023半导体大会上表示,具身智能(EmbodiedAI)是能理解、推理、并与物理世界互动的智能系统,是人工智能的下一个浪潮。

具身智能最大的特质就是能够以主人公的视角去自主感知物理世界,用拟人化的思维路径去学习,从而做出人类期待的行为反馈,而不是被动的等待数据投喂。通过提供基于人类行为学习和反馈系统,人形机器人为探索更复杂的行为语义提供了迭代的基础和实验场。因此,人形机器人的逐步完善也为具身智能的落地提供了方向,是具身智能的重要应用场景,也将为具身智能的迭代优化提供方向和空间。

五、专利技术:机器人、大模型专利申请逐年增加

1.机器人专利:

近年来,机器人与前沿科技产业,诸如:大数据,人工智能等结合愈加紧密,特别是人形机器人的出现,让机器人作为科技产业的“技术”含量日益提升。

从数量来看,机器人专利保持稳定增长,2022年申请专利2.3万余项;从类型上来看,发明专利与实用新型占比较高,两者之和占总数的9成。

天眼新知 | 机器人从未来而来 与大模型碰撞出“智慧”的火花

2.大模型专利:

大模型的“爆发”也并非没有征兆。在人工智能领域,作为其“皇冠上的明珠”,自然语言处理是理解人类语言、情感和思想的技术,从其“寥寥数语”的介绍中,就可以发现它对于“机器”到底“因何为人”的重要性与超高的难度。

从近年来专利申请的数量来看,还是保持了较为稳定快速的增长,自2018以来,其申请量的复合增长率达到61.2%;

从类型上来看,发明专利占据绝对的领先地位,占比近98%。

天眼新知 | 机器人从未来而来 与大模型碰撞出“智慧”的火花

据天眼查研究院称,利用大型模型技术推动人工智能已经实现了一个具有历史性意义的跨越,未来还有许多广阔的创新空间可探索。中国的高水平经济社会发展为创新大型模型提供了充足的场景和数据基础,因此人工智能在中国有着巨大的发展潜力。

以上是天眼新知 | 机器人从未来而来 与大模型碰撞出“智慧”的火花的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文转载于:搜狐。如有侵权,请联系admin@php.cn删除
10个生成AI编码扩展,在VS代码中,您必须探索10个生成AI编码扩展,在VS代码中,您必须探索Apr 13, 2025 am 01:14 AM

嘿,编码忍者!您当天计划哪些与编码有关的任务?在您进一步研究此博客之前,我希望您考虑所有与编码相关的困境,这是将其列出的。 完毕? - 让&#8217

烹饪创新:人工智能如何改变食品服务烹饪创新:人工智能如何改变食品服务Apr 12, 2025 pm 12:09 PM

AI增强食物准备 在新生的使用中,AI系统越来越多地用于食品制备中。 AI驱动的机器人在厨房中用于自动化食物准备任务,例如翻转汉堡,制作披萨或组装SA

Python名称空间和可变范围的综合指南Python名称空间和可变范围的综合指南Apr 12, 2025 pm 12:00 PM

介绍 了解Python功能中变量的名称空间,范围和行为对于有效编写和避免运行时错误或异常至关重要。在本文中,我们将研究各种ASP

视觉语言模型(VLMS)的综合指南视觉语言模型(VLMS)的综合指南Apr 12, 2025 am 11:58 AM

介绍 想象一下,穿过​​美术馆,周围是生动的绘画和雕塑。现在,如果您可以向每一部分提出一个问题并获得有意义的答案,该怎么办?您可能会问:“您在讲什么故事?

联发科技与kompanio Ultra和Dimenty 9400增强优质阵容联发科技与kompanio Ultra和Dimenty 9400增强优质阵容Apr 12, 2025 am 11:52 AM

继续使用产品节奏,本月,Mediatek发表了一系列公告,包括新的Kompanio Ultra和Dimenty 9400。这些产品填补了Mediatek业务中更传统的部分,其中包括智能手机的芯片

本周在AI:沃尔玛在时尚趋势之前设定了时尚趋势本周在AI:沃尔玛在时尚趋势之前设定了时尚趋势Apr 12, 2025 am 11:51 AM

#1 Google推出了Agent2Agent 故事:现在是星期一早上。作为AI驱动的招聘人员,您更聪明,而不是更努力。您在手机上登录公司的仪表板。它告诉您三个关键角色已被采购,审查和计划的FO

生成的AI遇到心理摩托车生成的AI遇到心理摩托车Apr 12, 2025 am 11:50 AM

我猜你一定是。 我们似乎都知道,心理障碍包括各种chat不休,这些chat不休,这些chat不休,混合了各种心理术语,并且常常是难以理解的或完全荒谬的。您需要做的一切才能喷出fo

原型:科学家将纸变成塑料原型:科学家将纸变成塑料Apr 12, 2025 am 11:49 AM

根据本周发表的一项新研究,只有在2022年制造的塑料中,只有9.5%的塑料是由回收材料制成的。同时,塑料在垃圾填埋场和生态系统中继续堆积。 但是有帮助。一支恩金团队

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
3 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳图形设置
3 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您听不到任何人,如何修复音频
3 周前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解锁Myrise中的所有内容
4 周前By尊渡假赌尊渡假赌尊渡假赌

热工具

螳螂BT

螳螂BT

Mantis是一个易于部署的基于Web的缺陷跟踪工具,用于帮助产品缺陷跟踪。它需要PHP、MySQL和一个Web服务器。请查看我们的演示和托管服务。

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

MinGW - 适用于 Windows 的极简 GNU

MinGW - 适用于 Windows 的极简 GNU

这个项目正在迁移到osdn.net/projects/mingw的过程中,你可以继续在那里关注我们。MinGW:GNU编译器集合(GCC)的本地Windows移植版本,可自由分发的导入库和用于构建本地Windows应用程序的头文件;包括对MSVC运行时的扩展,以支持C99功能。MinGW的所有软件都可以在64位Windows平台上运行。

PhpStorm Mac 版本

PhpStorm Mac 版本

最新(2018.2.1 )专业的PHP集成开发工具

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用