[YOLO专题-27]：YOLO V5 小目标检测遇到的问题与常见解决办法_java

作者主页(文火冰糖的硅基工坊)：文火冰糖（王文兵）的博客_文火冰糖的硅基工坊_CSDN博客

本文网址：[YOLO专题-27]：YOLO V5 小目标检测遇到的问题与常见解决办法_文火冰糖（王文兵）的博客-CSDN博客

第1章前言：

第2章小目标检测常见问题

2.1 大小目标混合的场合

2.2 只有小目标的场合

第3章小目标检测困难的原因

3.1 模型对小目标总数的支持不够

3.2 小目标漏检率太高

3.3 解决问题的基本思路

第4章小目标检测可能的解决之道：输入图片

4.1 目标数量超标

4.2 目标像素太少

第5章小目标检测可能的解决之道：预测模型

5.1 针对目标数量超标的问题

5.2 针对目标像素太少的问题：统一模型

5.3 针对目标像素太少的问题：分离模型

第1章前言：

在实际应用中，有时候，在一张图片中有大目标，也有小目标，且小目标的数量可能远远大于大目标的数量，同一个模型要检测大目标和小目标时，对小目标的检测效果往往不尽如人意。

本文就是探讨小目标检测的问题以及可能的解决办法。

第2章小目标检测常见问题 2.1 大小目标混合的场合

在这种场合中，一张图片上有少数的大目标，有小目标。

常见的问题有：

（1）能够准确地检测到大目标，但检测不到小目标

（2）小目标的recall 率很低，大量的小目标检测不到，被遗漏

（3）小目标的数量太多，模型对小目标总是的支持不够

2.2 只有小目标的场合

在这种场合中，一张图片上全是小目标。

（1）小目标的recall 率很低，大量的小目标检测不到，被遗漏

（2）小目标的数量太多，模型对小目标总数的支持不够

第3章小目标检测困难的原因

在找到或提供解决办法之前，首先弄清楚不同问题原因。

3.1 模型对小目标总数的支持不够

这种情况来自两个主要方面的原因：

（1）图片本身：单张图片的目标太多

有时候，单张图片中小目标的数量太多，比如细胞的图片，一张图片中，包含了上百万个细胞，这就不是模型本身的问题了，而是图片的问题。

（2）模型本身：模型设计的限制

模型对单张图片支持的目标的数量受限于模型本身的设计，如果图片中目标的数量超出了模型支持的最大数量，自然会出现模型对小目标总数支持不够的问题。

3.2 小目标漏检率太高

这种情况，单张图片中小目标的数量完全满足模型设计的要求，这时候，依然会出现大量小目标检测不到的情况。这里也分为两种原因：

（1）图片本身

小目标包含的像素少，比如，一张尺寸为640 * 640的图片，大目标的像素通常大于 100 * 100，这种情形下。而小目标的像素通常只有10*10个像素点，甚至更少。

从上图中可以看出，小目标与大目标在长度和宽度尺寸上相差超过10倍以上，像素点（面积）相差上百倍。

像素点越少，目标图片，经过卷积后的特征就更少了，那么用于目标检测和分类的特征就更少了。

能够提供的原始信息越少，则被漏检的可能性就越大。

（2）模型本身

通常情况下，模型是通过卷积来提取原始图片像素中包含的特征的，感受野就反应了单个高层特征的信息与原始像素之间的对应关系，在网络卷积核确定的情况下，随着网络层数的增加，单个高层特征反应原始图片像素的范围就越大，视野就越宽，高层信息越是能够反应原始图片中物体的宏观轮廓。如下图所示：

然后，随着网络层数的增加和感受野的变大，微观的信息就会丢失，这样对于小目标的信息就会聚合到一个点，小目标原本包含的像素就少，随着感受野的增加，聚合后的特征就更少了，比如10*10像素的小目标，经过卷积后的特征可能就只有1*1，甚至出现多个10*10像素的小目标，经过多次卷积核，合并成了一个特征。这样，小目标就无法识别。

因此，深层的多次卷积，对于小目标的微观特征实际上是不利的。

3.3 解决问题的基本思路

综上所述，要解决小目标检测问题，需要从两个角度来解决

（1）输入图片

（2）预测模型

第4章小目标检测可能的解决之道：输入图片 4.1 目标数量超标

（1）先把图片切分成多张图片，然后对每张图片单独进行检测，最后进行汇总

这种方法的难点是：需要处理好图片与图片之间的切割线上的目标，因此需要通过一定的重叠区来解决。

4.2 目标像素太少

（1）局部放大

通剪切的方式获取包含小目标的一片图片，然后对剪切后的图片进行像素增强，最后对增强后的图片进行目标检测。这种方法优点类似现实生活发现小目标的方法：先聚焦聚焦，然后放大，再进行鉴别。

这种方法的难点是：如何剪切包含小目标的图片，依据什么原则来截取大图片的区域。计算机如何知道那片区域包含小目标？区域的大小、边界如何确定？

（2）整体增强

对整张图片进行数据增强，甚至增加图片的尺寸
通过高倍的照相机获取高分辨率的图片

这种方法的问题是：连同大目标一并进行了增强，导致整张图片的像素变得非常大，而对于大目标而言，这种增强是没有意义的，导致预测的时间变长。

在高分辨率的情况下，小目标也具备清晰的特征和较多的像素。

（3）增加没有目标的背景图片

通过明确的告诉网络，什么是没有目标的背景，什么是目标，这样通过背景与目标的反差，就能够区分出图片中微小的物体。

这种地面上没叶子的图片就可以作为背景，以区分地面与地面上小目标：叶子。

第5章小目标检测可能的解决之道：预测模型 5.1 针对目标数量超标的问题

通过修改或选择支持更多目标的模型，支持的目标越多，模型所需要的内存越大。

5.2 针对目标像素太少的问题：统一模型

这种方式下，大目标和小目标处于相同的图片上，采用相同的图片训练同一个模型。

训练出来的模型，同时识别大目标与小目标。

为了能够更好的识别小目标，可以采用的方法有：

（1）降低网络的层数：避免多个小目标经过多层卷积核混合在一起，无法区分。

（2）减少卷积核的尺寸：编码小目标的所有像素卷积成一个特征。

（3）减小步长：避免跳过部分小目标的像素提取。

总之，为了迎合小目标的识别，需要牺牲对大目标的更高层次的抽象。

5.3 针对目标像素太少的问题：分离模型

针对大目标和小目标，采用不同的模型和数据集进行训练和预测。

（1）识别大目标时：

不识别小目标，小目标作为背景
尽可能采用大型、深层次网络提取

（2）识别小目标时：

不识别大目标、大目标作为背景
尽可能采用小型、浅层次网络提取特征
训练图片，可以是原始图片，也可以是从原始图片截取的包含小目标的图片。

作者主页(文火冰糖的硅基工坊)：文火冰糖（王文兵）的博客_文火冰糖的硅基工坊_CSDN博客

本文网址：[YOLO专题-27]：YOLO V5 小目标检测遇到的问题与常见解决办法_文火冰糖（王文兵）的博客-CSDN博客

欢迎分享，转载请注明来源：内存溢出

原文地址: http://outofmemory.cn/langs/739323.html

[YOLO专题-27]：YOLO V5 小目标检测遇到的问题与常见解决办法

发表评论

评论列表（0条）