TPAMI 2021|听声识物:视音一致性下的视觉物体感知
2022年3月5日 - 腾讯新闻
首先,无需额外代价,声源定位任务所提供的定位图便能转换为物体大致的边界框。其次,判别性声源定位为画面中的发声物体分配了类别伪标签。在拓展实验中,该研究利用单声源定位所得到的定位图构造物体的边界框,并与物体的类别伪标签一起作为监督信号,在无需物体检测标注的情况下训练物体检测器。ImageNet子集上的可视化...
详情
首先,无需额外代价,声源定位任务所提供的定位图便能转换为物体大致的边界框。其次,判别性声源定位为画面中的发声物体分配了类别伪标签。在拓展实验中,该研究利用单声源定位所得到的定位图构造物体的边界框,并与物体的类别伪标签一起作为监督信号,在无需物体检测标注的情况下训练物体检测器。ImageNet子集上的可视化...