搜索
首页科技周边人工智能ADMap:抗干扰在线高精地图新思路

ADMap:抗干扰在线高精地图新思路

Mar 07, 2024 pm 12:30 PM
模型高精地图

写在前面&笔者的个人理解

很高兴受邀参加自动驾驶之心的活动,我们将分享在线重建矢量化高精度地图的抗扰动方法ADMap。你可以在https://github.com/hht1996ok/ADMap 上找到我们的代码。感谢大家的关注和支持。

在自动驾驶领域,在线高清地图重建对于规划和预测任务具有重要意义,近期的工作构建了许多高性能的高清地图重建模型来满足这一需求。然而矢量化实例内部的点序由于预测偏差可能会出现抖动或锯齿现象,从而影响后续任务。因此,我们提出了Anti-Disturbance Map reconstruction framework(ADMap)。本文希望兼顾模型速度和整体的精度,并且在部署时不会让工程师们感到困扰。因此,提出了三个高效且有效的模块:Multi-Scale Perception Neck(MPN)、Instance Interactive Attention(IIA)和Vector Direction Difference Loss(VDDL)。通过级联的探索实例间和实例内部的点序关系,我们的模型更好地监督了点序的预测过程。

我们在nuScenes和Argoverse2数据集中验证了ADMap的有效性。实验结果表明,ADMap在各项基准测试中均表现出最佳性能。在nuScenes基准中,ADMap在使用仅相机数据和多模态数据的情况下,mAP相比基准分别提高了4.2%和5.5%。ADMapv2不仅降低了推理延迟,还显著提升了基线性能,最高mAP达到了82.8%。在Argoverse数据集中,ADMapv2的mAP提高至62.9%,同时帧率保持在14.8FPS。

总结来说,我们提出的ADMap主要有以下几点贡献:

  • 提出了端到端的ADMap,重建了更稳定的矢量化高精地图。
  • MPN在不增加推理资源的情况下更好的捕捉了多尺度信息,IIA完成了实例间和实例内部的有效交互,使点级特征更准确,VDDL更细致的约束了点序重建过程,在点序的几何关系上进行监督。
  • ADMap实现了矢量化高精地图的实时重建,并且在nuScenes基准和Argoverse2中达到了最高精度。

方法提出

如图1所示,实例中的预测点往往会不可避免的出现抖动或偏移现象,这种抖动会导致重建后的实例矢量变得不平滑或锯齿状,严重影响了在线高精地图的质量和实用性。我们认为,其原因在于现有模型并未充分考虑实例间和实例内部的交互方式,实例点与地图拓扑信息不完全的交互会导致其预测位置的不准。此外仅通过L1 loss和cosine embedding loss等监督无法有效的利用几何关系来约束实例点的预测过程,网络需要利用各点间的矢量线段来精细捕捉点序的方向信息以更准确的约束每个点的预测过程。

ADMap:抗干扰在线高精地图新思路

为了缓解以上问题,我们创新的提出了Anti-Disturbance Map reconstruction framework(ADMap),实现了矢量化高精地图的实时稳定重建。

方法设计

如图2所示,ADMap通过多尺度感知颈(Multi-Scale Perception Neck,MPN)、实例交互注意力(Instance Interactive Attention,IIA)和矢量方向差损失(Vector Direction Difference Loss,VDDL)来更精细地预测点序拓扑结构。下面将分别介绍MPN、IIA以及VDDL。

ADMap:抗干扰在线高精地图新思路

Multi-Scale Perception Neck

为了获得更详细的BEV特征,我们引入了Multi-Scale Perception Neck(MPN)。MPN接收融合后的BEV特征作为输入。通过下采样,每个层级的BEV特征将连接到一个上采样层,以恢复原始尺寸的特征图。最终,各层级的特征图将合并成多尺度的BEV特征。

如图2中的虚线代表该步骤仅在训练时实施,实线代表训练和推理过程都会实施该步骤。在训练过程中,多尺度BEV特征图和每一层级的BEV特征图都会被送入Transformer Decoder,这使网络可以在不同尺度预测场景的实例信息以捕捉更精细的多尺寸特征。而在推理过程中,MPN仅保留多尺度BEV特征,不会输出各层级特征图,这保证了该neck在推理时的资源占用不变。

Transformer Decoder

Transformer Decoder中定义了一组实例级别的查询和一组点级别的查询,随后将点级别查询共享到所有实例中,这些分层查询被定义为:

ADMap:抗干扰在线高精地图新思路

解码器包含几个级联的解码层,这些层迭代地更新分层查询。在各解码层中,分层查询被输入到自注意力机制中,这使得分层查询间可以相互交换信息,Deformable Attention被用来交互分层查询和多尺度BEV特征。

Instance Interactive Attention

为了在解码阶段更好的获取各实例特征,我们提出了Instance Interactive Attention(IIA),其由Instances self-attention和Points self-attention组成。不同于MapTRv2并行提取实例级和点级别的嵌入,IIA级联地提取了查询嵌入。实例嵌入间的特征交互进一步帮助了网络学习点级嵌入间的关系。

ADMap:抗干扰在线高精地图新思路

如图3所示,Deformable cross-attention输出的分层嵌入被输入到Instances self-attention。将点维度与通道维度合并后维度变换为。随后,分层嵌入接入由多个MLP组成的Embed Layer中获得实例查询,该查询被放入Multi-head self-attention中来捕捉实例间的拓扑关系,得到实例嵌入。为了在点级嵌入中融入实例级别信息,我们将实例嵌入和分层嵌入相加。相加后的特征被输入至Point self-attention中,对各实例内的点特征进行交互,进一步精细关联了点序间的拓扑关系。

Vector Direction Difference Loss

高精地图中包含了矢量化的静态地图元素,包括车道线、路沿和人行横道等。ADMap针对这些开放形状(车道线、路沿)和封闭形状(人行横道)提出了Vector Direction Difference Loss。我们建模了实例内部的点序矢量方向,通过预测矢量方向和真实矢量方向的差值可以更细致的监督点的方向。此外,真实矢量方向差较大的点被认为代表了部分场景拓扑的剧烈变化(更不容易预测),更加需要被模型关注。因此,真实矢量方向差较大的点被赋予了更大的权重,以保证网络可以准确预测到这个剧烈变化的点。

ADMap:抗干扰在线高精地图新思路

图4展示了预测点序{ 和真实点序{ 中对预测矢量线{ 和真实矢量线{ 的初始建模。为了保证相反的角度不会得到相同的损失,我们计算矢量线角度差余弦值θ':

ADMap:抗干扰在线高精地图新思路

其中函数累加了矢量线的坐标位置,代表归一化操作。我们利用真实实例中各点的矢量角度差来为它们赋予不同大小的权重。权重定义如下:

ADMap:抗干扰在线高精地图新思路

其中代表实例中点的数量,函数代表底数为e的指数函数。由于首尾两点无法计算矢量角度差,因此我们将首尾点的权重设置为1。当真实值中的矢量角度差变大时,我们赋予该点更大的权重,这使得网络更为关注显著变化的地图拓扑结构。点序中各点的角度差损失定义为:

ADMap:抗干扰在线高精地图新思路

我们使用θ将损失值的区间调整为[0.0, 2.0]。通过将各点的相邻矢量线角度差余弦相加,该损失更全面的涵盖了各点的几何拓扑信息。由于首尾两点仅有一根相邻矢量线,因此首尾两点的损失为单个矢量角度差的余弦值。

实验

为了公平的评估,我们将地图元素分为车道线、道路边界和人行横道三种。采用平均精度(AP)来评估地图构建的质量,使用预测点序和真实点序的chamfer距离之和来判断两者是否匹配。Chamfer距离阈值设置为[0.5, 1.0, 1.5],我们分别在这三种阈值下计算AP,并将平均值作为最终指标。

对比实验

ADMap:抗干扰在线高精地图新思路

表1报告了ADMap和最先进方法在nuScenes数据集的指标。在camera-only框架下,ADMap的mAP相较于baseline(MapTR)提高了5.5%,ADMapv2相较于baseline(MapTRv2)提高了1.4%。 ADMapv2最高mAP达到82.8%,取得当前基准中最佳性能,部分细节会在后续arxiv版本中公布。在速度方面,ADMap相较于其baseline在FPS略微降低的情况下显着提高模型性能。值得一提的是,ADMapv2不仅提高了性能,在模型推理速度方面也有提升。

ADMap:抗干扰在线高精地图新思路

表2报告了ADMap和最先进方法在Argoverse2中的指标。在camera-only框架下,ADMap和ADMapv2相较于baseline分别提高了3.4%和1.3%。在多模态框架下,ADMap和ADMapv2达到了最佳性能,mAP分别为75.2%和76.9%。在速度方面。 ADMapv2相较于MapTRv2提升了11.4ms。

消融实验

在表 3 中,我们提供了在 nuScenes 基准上ADMap各个模块的消融实验。

ADMap:抗干扰在线高精地图新思路

表4给出了插入不同注意力机制对于最终性能的影响。 DSA表示decoupled self-attention,IIA表示实例交互注意力。结果表示IIA相较于DSA,mAP提高1.3%。

ADMap:抗干扰在线高精地图新思路

表5报告了在融合特征后增加backbone和neck层对mAP的影响。增加基于SECOND的backbone和neck层后,mAP提高了1.2%。而增加MPN后,在不增加推理时间的前提下,模型的mAP提高了2.0%。

ADMap:抗干扰在线高精地图新思路

表6报告了在nuScenes基准中增加VDDL对性能的影响。可以看到,当权重设置为1.0时,mAP最高,达到了53.3%。

ADMap:抗干扰在线高精地图新思路

表7报告了在nuScenes基准中,MPN下采样层数对最终性能的影响。下采样层数越多,模型推理速度越慢。因此,为了平衡速度和性能,我们设置了下采样层数为2。

ADMap:抗干扰在线高精地图新思路

为了验证ADMap有效缓解了点序扰动问题,我们提出了average chamfer distance(ACE)。我们挑选了chamfer distance之和小于1.5的预测实例,并计算它们的average chamfer distance(ACE)。当ACE越小代表实例点序预测的越准确。表8证明了ADMap可以有效缓解点云扰动这一问题。

ADMap:抗干扰在线高精地图新思路

可视化结果

下面两幅图为nuScenes数据集和Argoverse2数据集中的可视化结果。

ADMap:抗干扰在线高精地图新思路

ADMap:抗干扰在线高精地图新思路

总结

ADMap是一个高效且有效的矢量化高精地图重建框架,其有效缓解了实例矢量的点序由于预测偏差可能会出现的抖动或锯齿现象。大量实验表明,我们提出的方法在nuScenes和Argoverse2基准上均取得最佳性能。我们相信ADMap协助推进矢量高精地图重建任务的研究,从而更好地推动自动驾驶等领域的发展。

以上是ADMap:抗干扰在线高精地图新思路的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文转载于:51CTO.COM。如有侵权,请联系admin@php.cn删除
外推指南外推指南Apr 15, 2025 am 11:38 AM

介绍 假设有一个农民每天在几周内观察农作物的进展。他研究了增长率,并开始思考他的植物在几周内可以生长的高度。从Th

软AI的兴起及其对当今企业的意义软AI的兴起及其对当今企业的意义Apr 15, 2025 am 11:36 AM

软AI(被定义为AI系统,旨在使用近似推理,模式识别和灵活的决策执行特定的狭窄任务 - 试图通过拥抱歧义来模仿类似人类的思维。 但是这对业务意味着什么

为AI前沿的不断发展的安全框架为AI前沿的不断发展的安全框架Apr 15, 2025 am 11:34 AM

答案很明确 - 只是云计算需要向云本地安全工具转变,AI需要专门为AI独特需求而设计的新型安全解决方案。 云计算和安全课程的兴起 在

生成AI的3种方法放大了企业家:当心平均值!生成AI的3种方法放大了企业家:当心平均值!Apr 15, 2025 am 11:33 AM

企业家,并使用AI和Generative AI来改善其业务。同时,重要的是要记住生成的AI,就像所有技术一样,都是一个放大器 - 使得伟大和平庸,更糟。严格的2024研究O

Andrew Ng的新简短课程Andrew Ng的新简短课程Apr 15, 2025 am 11:32 AM

解锁嵌入模型的力量:深入研究安德鲁·NG的新课程 想象一个未来,机器可以完全准确地理解和回答您的问题。 这不是科幻小说;多亏了AI的进步,它已成为R

大语言模型(LLM)中的幻觉是不可避免的吗?大语言模型(LLM)中的幻觉是不可避免的吗?Apr 15, 2025 am 11:31 AM

大型语言模型(LLM)和不可避免的幻觉问题 您可能使用了诸如Chatgpt,Claude和Gemini之类的AI模型。 这些都是大型语言模型(LLM)的示例,在大规模文本数据集上训练的功能强大的AI系统

60%的问题 -  AI搜索如何消耗您的流量60%的问题 - AI搜索如何消耗您的流量Apr 15, 2025 am 11:28 AM

最近的研究表明,根据行业和搜索类型,AI概述可能导致有机交通下降15-64%。这种根本性的变化导致营销人员重新考虑其在数字可见性方面的整个策略。 新的

麻省理工学院媒体实验室将人类蓬勃发展成为AI R&D的核心麻省理工学院媒体实验室将人类蓬勃发展成为AI R&D的核心Apr 15, 2025 am 11:26 AM

埃隆大学(Elon University)想象的数字未来中心的最新报告对近300名全球技术专家进行了调查。由此产生的报告“ 2035年成为人类”,得出的结论是,大多数人担心AI系统加深的采用

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
4 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳图形设置
4 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您听不到任何人,如何修复音频
4 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.聊天命令以及如何使用它们
4 周前By尊渡假赌尊渡假赌尊渡假赌

热工具

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一个PHP/MySQL的Web应用程序,非常容易受到攻击。它的主要目标是成为安全专业人员在合法环境中测试自己的技能和工具的辅助工具,帮助Web开发人员更好地理解保护Web应用程序的过程,并帮助教师/学生在课堂环境中教授/学习Web应用程序安全。DVWA的目标是通过简单直接的界面练习一些最常见的Web漏洞,难度各不相同。请注意,该软件中

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

螳螂BT

螳螂BT

Mantis是一个易于部署的基于Web的缺陷跟踪工具,用于帮助产品缺陷跟踪。它需要PHP、MySQL和一个Web服务器。请查看我们的演示和托管服务。

SublimeText3 英文版

SublimeText3 英文版

推荐:为Win版本,支持代码提示!

mPDF

mPDF

mPDF是一个PHP库,可以从UTF-8编码的HTML生成PDF文件。原作者Ian Back编写mPDF以从他的网站上“即时”输出PDF文件,并处理不同的语言。与原始脚本如HTML2FPDF相比,它的速度较慢,并且在使用Unicode字体时生成的文件较大,但支持CSS样式等,并进行了大量增强。支持几乎所有语言,包括RTL(阿拉伯语和希伯来语)和CJK(中日韩)。支持嵌套的块级元素(如P、DIV),