Co-DETR：基于协作混合分配训练的DETR

2023-12-20 23:50:42

摘要

https://arxiv.org/pdf/2211.12860v5.pdf
本文观察到一个现象，即在DETR中使用一对一的集合匹配时，被分配为正样本的查询太少，导致对编码器输出的监督稀疏，这严重影响了编码器的判别特征学习，反之亦然，影响了解码器中的注意力学习。为了缓解这个问题，我们提出了一种新颖的协作混合分配训练方案，即Co-DETR，从多种标签分配方式中学习更高效、更有效的基于DETR的检测器。这种新的训练方案可以通过训练多个由一对多标签分配（如ATSS和Faster RCNN）监督的并行辅助头，轻松提高端到端检测器中编码器的学习能力。此外，我们通过从这些辅助头中提取正坐标来进行额外的定制正查询，以提高解码器中正样本的训练效率。在推理过程中，这些辅助头被丢弃，因此我们的方法不会给原始检测器引入额外的参数和计算成本，同时也不需要手工制作的非最大抑制（NMS）。我们进行了广泛的实验来评估所提出的方法在DETR变体上的有效性，包括DAB-DETR、Deformable-DETR和DINO-DeformableDETR。最先进的DINO-Deformable-DETR与Swin-L的结合在COCO val上的AP可以从58.5%提高到59.5%。令人惊讶的是，与ViT-L骨干网结合，我们在COCO test-dev上实现了66.0%的AP，在LVIS val上实现了67.9%的AP，以更少的模型大小明显超过了以前的方法。代码可在https://github.com/Sense-X/Co-DETR上获得。

1、简介

目标检测是计算机视觉中的一项基本任务，它要求我们定位对象并分类其类别。开创性的R-CNN系列[11、14、27]和一系列变体[31、37、44]，如ATSS[41

文章来源:https://blog.csdn.net/m0_47867638/article/details/135118419
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：veading@qq.com进行投诉反馈，一经查实，立即删除！