南方财经全媒体见习记者马嘉璐 南沙报道
机器人智能化的进一步发展被真实三维动态环境能力的不足所制约。”5月20日,国家科技创新领军人才、深圳大学计算机与软件学院院长黄惠在大湾区科学论坛“众里寻她”女科学家分论坛上介绍了她在智能图形感知方面取得的研究成果,利用无人机对三维空间进行全自动自主探索,用更小的数据量规模实现更高精度的建模。目前,这项成果处于国际领先地位,可在数字孪生、智能机器人制造等领域广泛应用。
更小的数据规模、更高的精度
中科院物理所曾科普了数字孪生的定义:数字孪生,英文名叫Digital Twin(数字双胞胎),也被称为数字映射、数字镜像。数字孪生是在某一设备或系统基础上创建一个数字化的“副本”,简单说就是将现实世界的实体物体转化为数字化的虚拟体验。
2023年初,中国信通院发布的《数字孪生城市产业图谱研究报告(2022)》观察到,我国数字孪生产业发展阶段正处于增长期,数字孪生城市建设市场活跃,市场主体不断扩大。数字孪生可以极大提升“元宇宙”的构建效率和真实体感,是“元宇宙”的重要组成部分,随着“元宇宙”概念的火热,数字孪生这一前沿技术也越来越被人们熟知。
以前,数据孪生需要用大量的人力和物力来收集数据,接着通过大量的计算来建立模型。黄惠指出,数据采集成本高昂、时效性低,三维建模的对象非结构化、无关联,正是当前数字孪生难以实现智能化、模块化、轻量化、结构化、通用化的痛点所在。
针对上述问题,近十年来,黄惠聚焦“智能图形和感知计算”攻克难点,主导提出优视精准摄影测量技术,通过便携无人机全自动采集达毫米级高清分辨率的城市三维快照,整个过程从端到端连续规划、众包协同,用最少视角争取最大覆盖,将大规模城市场景数据量缩减200倍,同时保证低于0.6米的几何细节损失度,使数据采集的设备投入能够缩减70%。实现多元信息的精准映射和良性代谢。这种技术已经在贴近式高精度城市三维航测的单个项目上被广泛应用,覆盖面积在全球范围内保持国际领先地位。
以对深圳市约2200平方公里的范围进行建模为例,在实际中,建模面临着空域协调难,高度限制多,天气影响频繁,数据质量差,采集时间长的挑战。如果用传统的建模方式,需要用2年时间采集6000万张图片的数据,建立60TB体量的模型,总成本达1.5亿。无法实现城市孪生三维基础的实时更新,因为采集方式的周期长且频率低。经过优视精准摄影测量技术的优化,则可以在不降低精度的前提下,在8个月内用2000万张照片数据建立6TB的小模型,总成本降至6000万,降幅达60%。
数字孪生在群体智能、无人驾驶、智慧城市、国土安全、工业制造等领域中都有着重要的价值和意义。”黄惠表示,优视精准摄影测量技术利用无人机对三维空间进行全自动自主探索,并实现云上计算,大大降低城市三维重建的成本和门槛,将来可广泛应用于高精度智能驾驶地图构建、实景三维导航、高精度城市管理信息平台等领域。
三维感知能力缺失“卡住机器人脖子”
《数字孪生城市产业图谱研究报告(2022)》提出,近年来人工智能技术逐渐应用于建模领域,图片建模、视频建模成为未来发展趋势。据黄惠表示,应用人工智能辅助机器人研究或许可提升数据分析效率,并助于找到更高效的三维建模方案。她透露,她和她的团队正在研究结合智能图形和人工智能的方法,以进一步推进智能机器人的研究。
一个智能图形感知的挑战在于缺乏可用于大规模训练的数据,与ChatGPT相比。黄惠介绍道,ChatGPT所使用的原始数据基本上都经过了人工的筛选、标注,是“干净”的,但这一点延伸到三维空间,难度会大幅增加。一件物品可以被拍摄1000次,但所有这1000张照片都可能无法完整准确地描述这件物品。重新表述如下:这意味着当训练人工智能模型处理小范围三维空间数据时,将需要处理大量的数据量。
机器人智能化被卡住了脖子,是因为缺乏真实三维动态环境能力。”为什么这么难?黄惠用常见的扫地机器人来类比解释:要让扫地机器人在平面上移动、感知并躲避障碍物、防止自己被卡住,现在并不容易。与它相比,智能图形感知要能够在三维空间内判断物体的形状,进而判断出物体的功能、动静关系,赋予机器人可以更高级感知的具身智能,能够真正地直面和改变真实的三维复杂动态环境,像人一样“看见即理解、所见即所得”,作出决策和行动。
经过二十余年基础研究的沉淀,黄惠带领团队尝试拉通了环境感知、几何建模、语义理解、自主决策的整个链条。但与ChatGPT这样在自然语言理解方面取得显著进步的人工智能技术相比,仍然有很多关键科学问题没有得到解决,“还有很长的路要走”。
更多内容请下载21财经APP
以上是大湾区科学论坛|深圳大学教授黄惠:智能图形感知解决机器人“卡脖子”问题的详细内容。更多信息请关注PHP中文网其他相关文章!

斯坦福大学以人为本人工智能研究所发布的《2025年人工智能指数报告》对正在进行的人工智能革命进行了很好的概述。让我们用四个简单的概念来解读它:认知(了解正在发生的事情)、欣赏(看到好处)、接纳(面对挑战)和责任(弄清我们的责任)。 认知:人工智能无处不在,并且发展迅速 我们需要敏锐地意识到人工智能发展和传播的速度有多快。人工智能系统正在不断改进,在数学和复杂思维测试中取得了优异的成绩,而就在一年前,它们还在这些测试中惨败。想象一下,人工智能解决复杂的编码问题或研究生水平的科学问题——自2023年

Meta的Llama 3.2:多模式和移动AI的飞跃 Meta最近公布了Llama 3.2,这是AI的重大进步,具有强大的视觉功能和针对移动设备优化的轻量级文本模型。 以成功为基础

本周的AI景观:进步,道德考虑和监管辩论的旋风。 OpenAI,Google,Meta和Microsoft等主要参与者已经释放了一系列更新,从开创性的新车型到LE的关键转变

连接的舒适幻想:我们在与AI的关系中真的在蓬勃发展吗? 这个问题挑战了麻省理工学院媒体实验室“用AI(AHA)”研讨会的乐观语气。事件展示了加油

介绍 想象一下,您是科学家或工程师解决复杂问题 - 微分方程,优化挑战或傅立叶分析。 Python的易用性和图形功能很有吸引力,但是这些任务需要强大的工具

Meta's Llama 3.2:多式联运AI强力 Meta的最新多模式模型Llama 3.2代表了AI的重大进步,具有增强的语言理解力,提高的准确性和出色的文本生成能力。 它的能力t

数据质量保证:与Dagster自动检查和良好期望 保持高数据质量对于数据驱动的业务至关重要。 随着数据量和源的增加,手动质量控制变得效率低下,容易出现错误。

大型机:AI革命的无名英雄 虽然服务器在通用应用程序上表现出色并处理多个客户端,但大型机是专为关键任务任务而建立的。 这些功能强大的系统经常在Heavil中找到


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

PhpStorm Mac 版本
最新(2018.2.1 )专业的PHP集成开发工具

ZendStudio 13.5.1 Mac
功能强大的PHP集成开发环境

Atom编辑器mac版下载
最流行的的开源编辑器

SecLists
SecLists是最终安全测试人员的伙伴。它是一个包含各种类型列表的集合,这些列表在安全评估过程中经常使用,都在一个地方。SecLists通过方便地提供安全测试人员可能需要的所有列表,帮助提高安全测试的效率和生产力。列表类型包括用户名、密码、URL、模糊测试有效载荷、敏感数据模式、Web shell等等。测试人员只需将此存储库拉到新的测试机上,他就可以访问到所需的每种类型的列表。

WebStorm Mac版
好用的JavaScript开发工具