清华大学取得三维目标检测专利,提高了三维目标检测的精度
专利摘要显示,本申请提供了一种基于图卷积的视觉激光融合的三维目标检测方法,涉及自动驾驶技术领域,该方法包括:对点云数据的每个体素块的特征向量进行图卷积操作,得到二维的体素特征;利用第一检测器对体素特征进行处理,得到原始点云ROI区域,从原始点云ROI区域提取出原始点云ROI特征;对点云数据进行处理得到密集深度图,利...
中科院声学所黄海宁团队:声呐图像水下目标识别综述与展望
分类识别的主要工作是将ROI分配到预定义的类中,例如利用卷积神经网络对SAS图像目标进行分类识别、利用迁移学习进行模型微调、利用小样本学习降低过拟合。深度学习的目标检测则是以包围框的形式直接输出物体的位置和类型,多会结合注意力机制以及轻量化网络,在提高检测性能的同时减小计算复杂度。二维声呐图像的传统机...
首个目标检测扩散模型,比Faster R-CNN、DETR好,从随机框中直接检测
近日,来自香港大学的罗平团队、腾讯AILab的研究者联合提出一种新框架DiffusionDet,将扩散模型应用于目标检测。据了解,还没有研究可以成功地将扩散模型应用于目标检测,可以说这是第一个采用扩散模型进行目标检测的工作。DiffusionDet的性能如何呢?在MS-COCO数据集上进行评估,使用ResNet-50作为骨干,在单一...
BEV目标检测之视觉毫米波雷达融合
3D目标检测是机器人/自动驾驶平台的一项重要任务。目标检测是两个基本计算机视觉问题的结合,即分类和定位,其目的是检测预定义类的所有实例,并使用轴对齐的框在图像/BEV空间中提供其定位。它通常被视为一个利用大量标记图像的监督学习问题,目标检测任务中的几个关键挑战包括:boxBEV表示:相机图像在透视图中,但下游自...
无需标注海量数据,目标检测新范式OVD让多模态AGI又前进一步
目标检测是计算机视觉中一个非常重要的基础任务,与常见的的图像分类/识别任务不同,目标检测需要模型在给出目标的类别之上,进一步给出目标的位置和大小信息,在CV三大任务(识别、检测、分割)中处于承上启下的关键地位。当前大火的多模态GPT-4在视觉能力上只具备目标识别的能力,还无法完成更高难度的目标检测...
何恺明组新论文:只用ViT做主干也可以做好目标检测
当前的目标检测器通常由一个与检测任务无关的主干特征提取器和一组包含检测专用先验知识的颈部和头部组成(www.e993.com)2024年10月23日。颈部/头部中的常见组件可能包括感兴趣区域(RoI)操作、区域候选网络(RPN)或锚、特征金字塔网络(FPN)等。如果用于特定任务的颈部/头部的设计与主干的设计解耦,它们可以并行发展。从经验上看,目标检测研究受益...
AAAI 2023 Oral | 回归元学习,基于变分特征聚合的少样本目标检测...
少样本目标检测器通常在样本较多的基础类进行训练,然后在样本较少的新颖类上进行微调,其学习到的模型通常偏向于基础类,并且对新颖类样本的方差敏感。为了解决这个问题,腾讯优图实验室联合武汉大学提出了基于变分特征聚合的少样本目标检测模型VFA,大幅刷新了FSOD指标。本工作已入选AAAI2023Oral。
史上最全综述:3D目标检测算法汇总!(4)
中融合方法试图在基于LiDAR的3D目标检测器的中间阶段,例如在骨干网络中,在proposal生成阶段,或在RoI细化阶段,融合图像和激光雷达特征。具体分类见下图。中融合方法建议对多模态表示进行更深入的融合,并产生更高质量的3D框。然而,相机和激光雷达的特征本质上是异构的,来自不同的视角,因此在融合机制和视角对齐方面还存在...
ECCV 2022 | 中科大&京东提出:数据高效的Transformer目标检测器
去除RoIAlign。SparseRCNN和RCNNsfamily中的其他检测器一样根据目标检测的候选框对图像中指定区域的特征做采样,再基于采样后的特征做预测。对比之下,DETR中contentquery直接从图像的全局特征中聚合特定物体的信息。在本步骤,我们去除RoIAlign操作。可以看到,模型的性能发生了显著下降。我们猜想从全局特征中学习如何关...
FairMOT:多目标检测与再识别的公平性研究目标跟踪
使用卡尔曼滤波器和reid特征来获得初始跟踪结果。具体是,使用卡尔曼滤波器预测目标在后续帧的位置,之后计算预测框和检测框之间的马氏距离,与DeepSORT方法类似。然后计算基于reid特征的余弦距离,并融合马氏和余弦距离:,这里是权重参数在实验中预设为0.98。