作者 | 方法 | 优势 | 局限性 | 数据集 | |
邓姗姗 [20] | 使用高频增强后的图像和对比度增强后的图像作为算法输入样本,并利用多尺度卷积特征融合的方法,融合来自不同特征层的特征 | 平均精度均值mAP达到了97.9% | 由于融合过程训练 时间较长,检测速度有所降低 | 选取PASCAL VOC 2007数据集中的小目标类别 | |
朱玉华 [21] | 采用ResNet101与FPN相融合作为特征提取网络,生成多尺度特征图 | 改进的模型平均精度达到90.9% | 检测速度降低 | 共5000张来自施工现场采集和网络爬虫图片 | |
徐守坤 [22] | 运用多尺度训练和增加锚点数量增强网络检测不同尺寸目标的鲁棒性,引入防止正负样本不均衡的在线困难样本挖掘策略 | 检测准确率提高了7%,对环境的适应性更强 | 对于小目标、人员姿态多样性难以精确位置,检测精准度不够 | 共7000张不同施工场地的监控图像 | |
罗海保 [23] | 通过对RPN网络的改进解决了因初始建议框设计不合理导致无法召回小目标的问题;采用RoI Align的池化算法避免了使用RoI Pooling池化算法造成的连续两次量化误差 | 提高了网络对航拍图像小目标的检测精度和对网络检测速度 | 航拍图像鸟巢数据量不足,影响检测精度 | 航拍图像鸟巢测试集和VOC2007测试集 | |
S. Chen [24] | 采用了K-means++算法更好地适应小目标—安全帽 | 平均精度提升了8.1%,有效克服了距离、光线等因素的干扰,同时能识别多人 | 应用场景较单一,主要在变电站环境中,泛化能力差 | 带电作业场所监控录像截屏 | |