YOLOv4团队开源最新力作!1774fps、COCO最高精度,分别适合高低端GPU的YOLO( 三 )


作者通过实验发现:YOLOv4-P6(宽度缩放因子1)可以达到30fps的实时处理性能;YOLOv4-P7(宽度缩放因子1.25)可以达到15fps的处理速度 。
4 实验
作者在MSCOCO-2017数据集上验证了所提Scaled-YOLOv4的性能 , 作者提到并未采用ImageNet进行预训练 , 所有YOLOv4模型均从头开始训练 。
YOLOv4-tiny的训练了600epoch;YOLOv4CSP训练了300epoch;YOLOv4-large先训练了300epoch , 然后采用更强的数据增广技术训练了150epoch 。 其他训练相关的超参作者采用k-mean与遗传算法决定 。
在CSP-ized模型上的消融研究
作者首先针对CSP-ized模型进行了消融实验分析 , 结果见下表 。 作者从参数量、计算量、处理流程以及平均精度方面进行了CSP-ization的影响性分析 。
作者采用Darknet53作为骨干网络 , 选择FPN+SPP与PAN+SPP作为neck进行消融分析 。
作者同时还采用了LeakyReLU与Mish进行对比分析:
YOLOv4团队开源最新力作!1774fps、COCO最高精度,分别适合高低端GPU的YOLO文章插图
从上表可以看到:CSP-ized模型可以极大的降低参数量与计算量达32% , 同时带来性能上的提升;同时还可以看到:CD53s-CFPNSPP-Mish、CD53s-CPANSPP-Leaky与D53-FPNSPP-Leaky相同的推理速度 , 但具有更高的指标(分别搞1%和1.6%AP) , 且具有更低的计算量 。
在YOLOv4-tiny上的消融研究接下来 , 我们将通过实验来证实:CSPNet+partial的灵活性 。
作者将其与CSP-Darknet53进行了对比 , 结果见下表:
YOLOv4团队开源最新力作!1774fps、COCO最高精度,分别适合高低端GPU的YOLO文章插图
从上表可以看到:所设计的PCB技术可以使模型更具灵活性 , 因为它可以更具实际需要进行结构调整 。 同时也证实:线性缩放方式的局限性 。
作者最终选择COSA-2x2x作为YOLOv4-tiny , 因其取得最佳的精度-速度均衡 。
目标检测的Scaled-YOLOv4
YOLOv4团队开源最新力作!1774fps、COCO最高精度,分别适合高低端GPU的YOLO文章插图
上图给出了本文所提Scaled-YOLOv4与其他SOTA目标检测方法的对比 , 可以看到:所提方法在不同约束下均取得了最佳的均衡 。 比如 , YOLOv4-CSP与EfficientDet-D3具有相同的精度 , 但具有更开的推理速度(1.9倍);YOLOv4-P5与EfficientDet-D5具有相同的精度 , 推理速度则快2.9倍 。
类似现象可见:YOLOv4-P6 vs EfficientDet-D7 ,YOLOv4-P7 vs EfficientDet-D7x 。 更重要的是:所有Scaled-YOLOv4均达到了SOTA结果 。
与此同时 , 作者还给出了添加TTA后的YOLOv4-large性能 , 可以看到分别可以得到1.1% , 0.6%与0.4%AP的指标提升 。
YOLOv4团队开源最新力作!1774fps、COCO最高精度,分别适合高低端GPU的YOLO文章插图
作者还对比了YOLOv4-tiny与其他tiny目标检测器的性能对比 , 见下表 。
可以看到:YOLOv4-tiny取得了最佳的性能 。
YOLOv4团队开源最新力作!1774fps、COCO最高精度,分别适合高低端GPU的YOLO文章插图
最后 , 作者在不同的嵌入式GPU上测试了YOLOv4-tiny的性能 , 见下图 。 可以看到:无论哪种硬件平台下 , YOLOv4-tiny均可以达到实时性 。
经过TensorRT FP16优化后的YOLOv40tiny最高可以达到1774fps的推理速度 。
YOLOv4团队开源最新力作!1774fps、COCO最高精度,分别适合高低端GPU的YOLO文章插图
最后附上YOLO系列相关论文:1. YOLOv1:
2. YOLO 9000:
3. YOLO v3:
4. YOLO-Lite:
5. Gaussian YOLOv3:
6. REQ-YOLO:
7. xYOLO:
8. YOLO-Nano:
9. CSPNet:
10. YOLO v4:
11. Poly-YOLO:
【YOLOv4团队开源最新力作!1774fps、COCO最高精度,分别适合高低端GPU的YOLO】12. PP-YOLO:
YOLOv4团队开源最新力作!1774fps、COCO最高精度,分别适合高低端GPU的YOLO文章插图
YOLOv4团队开源最新力作!1774fps、COCO最高精度,分别适合高低端GPU的YOLO文章插图