目标检测:Anchor-Free时代
自从2018年8月CornerNet开始 , Anchor-Free的目标检测模型层出不穷 , 最近达到了井喷的状态 , 宣告着目标检测迈入了Anchor-Free时代 。
其实Anchor-Free并不是一个新概念了 , 大火的YOLO算是目标检测领域最早的Anchor-Free模型 , 而最近的Anchor-Free模型如FASF、FCOS、FoveaBox都能看到DenseBox的影子 。
下面主要讲一下有代表性的Anchor-Free模型(包括DenseBox、YOLO、CornerNet、ExtremeNet、FSAF、FCOS、FoveaBox) , 分成3个部分来介绍(早期探索、基于关键点、密集预测) , 具体细节就不展开了~
早期探索1 DenseBox
最早知道这篇文章 , 是在去年刚接触目标检测的时候 , 看了一篇地平线对DenseBox作者的采访 , 当时因为刚接触感触不深 , 但是从当前的时间节点回头看 , DenseBox的想法是多么的超前啊 。
采访中说道 , 当年DenseBox其实早在2015年初就已经开发出来了 , 这比同期的Faster-RCNN系列提前数月 , 但是论文直到9月才在arxiv上发布 。 如果DenseBox能在2015年初就发表 , 那么最近几年目标检测的发展会不会是另外一番景象呢~
两点贡献:
1.证明单个FCN可以检测出遮挡严重、不同尺度的目标 。
2.通过多任务引入landmark localization , 能进一步提升性能 。
文章插图
如图1所示 , 单个FCN同时产生多个预测bbox和置信分数的输出 。 测试时 , 整个系统将图片作为输入 , 输出5个通道的feature map 。 每个pixel的输出feature map得到5维的向量 , 包括一个置信分数和bbox边界到该pixel距离的4个值 。 最后输出feature map的每个pixel转化为带分数的bbox , 然后经过NMS后处理 。
Ground Truth Generation
文章插图
第一个通道ground truth map的正标签区域由半径为r的圆填充 , 圆的中心点位于bbox的中点 。 而剩下的4个通道由bbox的2个角点决定 。
Refine with Landmark Localization
文章插图
在FCN结构中添加少量层能够实现landmark localization , 然后通过融合landmark heatmaps和score map可以进一步提升检测结果 。
2 YOLO
YOLO将目标检测作为一个空间分离的边界框和相关的类概率的回归问题 。 可以直接从整张图片预测出边界框和分类分数 。
三个优点:
1.速度快
2.通过整幅图进行推理得到预测结果
3.能学到目标的一般特征
文章插图
Unified Detection
文章插图
YOLO将输入图片分成SXS个网格 , 如果某个目标的中心点落到其中一个格点 , 那么该格点就负责该目标的检测 。 每个格点预测出B个bbox和每个bbox的置信分数 。
定义置信度为:
文章插图
每个bbox由5个预测值组成:x , y , w , h 和 置信度 。 每个格点也预测C个类概率
文章插图
测试的时候 , 将类概率和置信分数相乘 , 得到类置信分数
文章插图
举个例子 , 在Pascal VOC数据集上评估YOLO , 使用S=7 , B=2 , VOC有20类 , 所以C=20 , 那么最终的预测结果是7x7x30的向量 。
DenseBox和YOLO的区别:
1.DenseBox应用于人脸检测 , 相当于只有两类 , 而YOLO是通用检测 , 通常大于两类 。
2.DenseBox是密集预测 , 对每个pixel进行预测 , 而YOLO先将图片进行网格化 , 对每个grid cell进行预测 。
3.DenseBox的gt通过bbox中心圆形区域确定的 , 而YOLO的gt由bbox中心点落入的grid cell确定的 。
基于关键点3 CornerNet
两点贡献:
1.通过检测bbox的一对角点来检测出目标 。
2.提出corner pooling , 来更好的定位bbox的角点 。
文章插图
Detecting Corners
文章插图
首先预测出两组heatmaps , 一组为top-left角点 , 另一组为bottom-right角点 。 每组heatmaps有C个通道 , 表示C个类别 , 尺寸为HxW 。 每个通道是一个binary mask , 表示一个类的角点位置 。
文章插图
- 三个目标之后|品味莲乡 | 品味
- 教学|机器人教学的目标方案
- 人民医院|加强冷链食品核酸检测 确保“舌尖上”的安全
- 商标|你知道为什么一定要检测商标吗?
- 检测|机器视觉检测解决方案商“鼎纳自动化”完成B轮亿元融资
- 美团|大和:上调美团目标价16.7%至350港元
- 比特|报告:比特币将成为2021年网络犯罪分子的主要目标
- 阴性|襄阳开展进口冷链食品新冠病毒防控检查 核酸检测均为阴性!
- 目标和意义进行|关于智能的新思考:我们为什么探索性提出智能三定律?
- 检测DTU信号是否稳定的4个方法
