计算机视觉研究中, 目标检测 是一个比分类更困难的领域,我们将回顾它的历史和最近的发展。 在深度学习时代之前,像 HOG 和特征金字塔这样的手工特性被广泛用于获取图像中的定位信号。 然而,这些方法通常不能很好地扩展到通用的目标检测,所以大多数的应用仅限于 人脸识别 或者行人检测。
一共搜集了65篇2D目标检测论文,涉及:通用目标检测、旋转目标检测、Few-shot/自监督/半监督/无监督目标检测等方向。 最新! CVPR 2021 视觉Transformer论文大盘点(43篇)
由于低分辨率低,像素有限,小目标检测很困难。 例如,通过只看下图上的目标,人类甚至很难识别这些物体。 然而,通过考虑到它位于天空中的背景,这个物体可以被识别为鸟类。 因此,我们认为,解决这个问题的关键取决于我们如何将上下文作为额外信息来帮助检测小目标。
有研究员提出了一种利用上下文的目标检测方法来提高检测小目标的精度。 该方法通过连接多尺度特征,使用了来自不同层的附加特征作为上下文。 研究员还提出了具有注意机制的目标检测,它可以关注图像中的目标,并可以包括来自目标层的上下文信息。 实验结果表明,该方法在检测小目标方面的精度高于传统的SSD框架。 下图显示了SSD框架无法检测到小目标时的案例情况。