您的当前位置:首页 > 新闻中心 > 开芯课堂丨视觉与4D毫米波前融合感知算法设计 正文
时间:2025-05-02 14:49:01 来源:网络整理 编辑:新闻中心
上海 2025年4月30日 /美通社/ -- 黑芝麻智能通过本文介绍了黑芝麻智能视觉与4D毫米波雷达前融合算法,通过多模态特征对齐和时序建模,显著提升逆光、遮挡等复杂场景下的目标检测精度,增强辅助驾驶
上海 2025年4月30日 /美通社/ -- 黑芝麻智能通过本文介绍了黑芝麻智能视觉与4D毫米波雷达前融合算法,开芯课堂通过多模态特征对齐和时序建模,丨视感知显著提升逆光、毫米遮挡等复杂场景下的波前目标检测精度,增强辅助驾驶安全性。融合
随着辅助驾驶技术逐步融入日常生活,算法设计其安全性成为社会关注焦点,开芯课堂尤其在复杂交通场景中目标检测的丨视感知稳定性和准确性成为行业研究核心。如何提升目标检测的毫米准确,稳定性,波前成为了行业内必须探讨和研究的融合议题。不同目标识别传感器的算法设计选择以及其配套的识别方案,对目标检测精度有着巨大的开芯课堂影响。
目标识别传感器选择
多传感器目标检测示意图
目前主流的传感器感知方案包括纯视觉、激光雷达与相机融合以及新兴的毫米毫米波雷达与相机融合,这三种方案各有优劣。
基于以上特点,毫米波雷达相机融合的方案成为了行业新趋势。基于AI的融合算法,如前融合点云投影、后融合目标级关联等逐步成熟。
行业毫米波雷达相机融合方案
辅助驾驶行业内,4D毫米波雷达相机融合方案正在加速落地,各头部车企都有相应的布局和应用:
黑芝麻智能融合团队,采用了4D毫米波雷达和相机融合的方案,结合深度学习模型,提升了雨雾雪、黑夜、逆光等极端天气和场景下目标检测的准确性和稳定性,改善了异形车、遮挡目标等物体检测的识别率,优化了上下坡、匝道等三维空间存在变化的场景中目标测距测速的精确性,显著提升了辅助驾驶的安全性与可行性。
黑芝麻智能 4D毫米波雷达相机融合方案
黑芝麻智能 4D毫米波雷达相机融合方案,在BEV纯视觉目标检测方案基础上,添加4D毫米波雷达特征提取分支。4D毫米波雷达点云在经过特征提取分支后,与图像分支提取的图像特征对齐并融合,组成时序信息,再经过目标head,输出目标相关的信息,其总体框架如下图所示:
黑芝麻智能4D毫米波雷达相机融合框架示意图
4D毫米波雷达特征提取模块
模块使用稀疏点云作为输入,包含3D位置信息,RCS信息,速度信息等。经过PointPillars骨干网络提取点云的局部特征,再经过基于Transformer的骨干网络捕获全局信息。PointPillars可以压缩冗余信息,提取局部特征;RCS编码增强目标检测的性能;Transformer强化关键特征,显著提升稀疏点云的利用率。
PointPillars提取点云局部特征
Pillar Feature Net提取点云特征示意图
采用Pillar编码的方式结构化编码毫米波雷达,将无序的雷达点云划分为规则的"柱状"(Pillar)单元,每个柱体内的点云通过简化特征(坐标、反射强度等)编码为固定维度的特征向量。通过局部特征聚合抑制噪声,保留有效目标信息,有效解决毫米波雷达点云稀疏且包含噪声的问题。针对多目标检测,柱状划分可以有效地捕捉分散的雷达点云(如行人、车辆),提升对小型或远距离目标的检测能力。
RCS编码提升检测性能
RSC编码示意图
采用基于RCS感知的BEV编码器,利用雷达截面(RCS)能够粗略衡量目标尺寸的特性,有效解决因雷达生成的BEV特征是稀疏的而带来的检测性能损失问题,即利用RCS作为目标尺寸,将一个雷达点的特征分散到BEV空间中的多个像素而不是一个像素。
Transformer捕获全局信息
Deformable attention module (图片来源:《Vision Transformer with Deformable Attention》)
Transformer的子注意力机制可以跨柱体建立关联,捕捉场景中目标之间的空间关系(如车辆与行人的相对位置),弥补传统卷积网络局部感受野的局限。并且采用动态权重分配的策略,根据目标重要性动态调整特征权重,例如在拥堵场景中强化相邻车辆的特征,抑制背景干扰。
多模态特征对齐时序模块
多模态特征间的对齐问题,一直是影响目标检测优劣的关键因素。
多模态特征对齐时序模块示意图
兼顾算力要求的多模态特征融合对齐
模块通过接收图像特征提取骨干网络的图像特征以及毫米波雷达特征提取骨干网络的雷达特征后,通过多模态特征对齐模块,将二者融合为一体。通过特征拼接,操作计算量极低,能够显著降低硬件的算力要求。并且不对原始特征进行压缩或者变化,保留了特征的原始信息,避免信息丢失,适合需要高保真度的场景。如果需要较强的时序建模能力,且算力资源较为丰富,亦可采用多模态deformable attention的方式来实现对齐。
temporal模块
按照时序添加temporal模块,叠加多帧目标的feature map,能够有效的获取目标的时序信息,大大提升了目标时序特征的准确性和稳定性,如位置、速度等。因采用多帧特征相结合的方式,能够有效提升遮挡目标的检测准确度。
测试指标和结果展示
测试指标说明
模型的测试指标主要通过以下几个方面进行对比:
结果
经过测试,相较于纯视觉模型,4D毫米波雷达相机融合模型,在纵向100米(自车前方),横向+-32米范围内,mAP提升5%,mATE提升2.5%,mAVE提升明显33.85%。
4D毫米波雷达具有全天候,成本适中,产业链较成熟等特点,目前正在成为行业内多模态融合目标检测任务中的重要传感器。实验结果表明,4D毫米波雷达相机融合方案,相较于纯视觉目标检测方案,有效提升了目标检测的精度,改善了纯视觉模型测距测速的性能,特别是极端场景下模型的表现,如光线局限场景、遮挡场景以及非同平面场景等,提升辅助驾驶的驾驶安全性。
句句遗憾句句不提遗憾的句子 遗憾而又意难平的文案2025-05-02 14:46
农业农村部公布第一批农业生产全程机械化示范县名单,山西6地入选2025-05-02 14:41
《怪物猎人:荒野》新活动任务来袭 历战王煌雷龙登场2025-05-02 14:22
澳大利亚全明星赛马阵容将亮相一级赛环绕锦标赛2025-05-02 14:09
中国足球持续20年无缘世少赛 被寄予厚望的国少怎么了2025-05-02 14:09
垫底+进球最少!队史最艰难开局 三镇需尽快止跌2025-05-02 13:59
2018平安夜一个人过的个性签名 伤感寂寞的个性签名大全2025-05-02 13:10
山西话·三晋寻龙记|龙翔山西,留下这些地名2025-05-02 12:44
云南玉昆主场首胜 有底气迎来9天内连续三个客场2025-05-02 12:22
哈里伯顿准绝杀字母哥空砍30+20+13 步行者淘汰雄鹿2025-05-02 12:03
跳桥救人的外卖小哥感动全网!最新后续→2025-05-02 14:26
2023九月再见了的伤感说说 九月再见十月你好伤感语录2025-05-02 13:55
忘记一个人很难的文案 想忘记一个人又忘不掉的文案2025-05-02 13:47
印度加尔各答一酒店起火 已致14人死亡2025-05-02 13:44
比较伤感的个性签名英文带翻译 这整个城市都亵渎了神明2025-05-02 13:44
一段可以拿《欢乐喜剧人》总冠军的马术表演2025-05-02 13:19
《怪物猎人:荒野》新活动任务来袭 历战王煌雷龙登场2025-05-02 13:15
满怀期待结局不尽人意的说说 愿望落空了的句子2025-05-02 12:55
小洋房装修设计效果图 小洋房装修设计要点2025-05-02 12:41
李铁案二审宣判:裁定驳回上诉 维持原判2025-05-02 12:20