在当前的研究中,以卷积神经网络为基础的目标检测方法被广泛应用,主要分为两类:双阶段目标检测和单阶段目标检测。双阶段目标检测是从输入图像中随机选出几千个候选区域,然后以这些候选框为基础进行二次修改,从而获得最终检测结果,虽然它的检测准确率比较高,但检测速度比较慢。双阶段目标检测的代表算法有R-CNN
[5]、Faster R-CNN
[6]等。Wang等
[7]使用Faster R-CNN对输电塔进行识别研究,并在小样本的情况下,对输电塔的检测取得了较好的识别效果。曹志勇等
[8]对Faster-RCNN进行了改进,将主干提取网络替换为ResNet-50,同时在检测过程中加入了多尺度特征融合技术。单阶段目标检测的代表就是YOLO系列算法,有YOLOv1
[9]、YOLOv2
[10]、YOLOv3
[11]等。为了解决密集目标检测的复杂场景中YOLOv3算法漏检现象,宋成根等
[12]将损失函数DIoU和非极大值抑制算法相结合,以提高杆塔目标检测的精度。Mo等
[13]将YOLOv4用于电塔的检测,对输电铁塔损坏的检测起到积极的作用。孙乐杨等
[14]将GDAL模块应用于YOLOv5网络中,以识别输电塔的地理坐标。目前,YOLO系列主流的目标检测算法YOLOv7
[15],在5~160帧/s的范围内检测精度和速度超过了绝大多数目标检测器。因此,本文尝试将YOLOv7应用到自建的输电塔数据集上,并对模型做出改进以提高输电塔检测算法的准确性和速度,为后续塔基区周围水土情况的研究奠定基础。本文的主要工作包括:1) 对无人机采集到的复杂地形下的图像进行筛选和预处理操作,保证数据集的高质量和多样性;2) 在原网络结构的Backbone层中添加CBAM
[16]注意力机制,用于提高对输电塔塔基特征的提取能力;3)引入WIoU v3
[17]代替原坐标损失函数CIoU
[18],以提高目标检测任务的准确性和稳定性。通过实验对比,发现改进后的算法检测精度得到了提高,为输电塔塔基高效检测提供了一种有效方案。