好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

基于改进YOLOv7算法的葡萄叶病斑检测方法研究.docx

10页
  • 卖家[上传人]:杨***
  • 文档编号:474907338
  • 上传时间:2024-05-02
  • 文档格式:DOCX
  • 文档大小:29.29KB
  • / 10 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    •     基于改进YOLOv7算法的葡萄叶病斑检测方法研究    李 天, 唐 璐(西华师范大学计算机学院, 四川南充 637000)0 引 言中国是葡萄生产大国,产量居世界首位 近年来,中国的葡萄产业正处于关键时期,葡萄种植农户不断调整和优化品种结构以及栽培模式,种植面积和产量稳步增长,向现代化、高质量的产业转型 然而,葡萄生长过程中经常受到黑腐病、轮斑病、褐斑病、叶枯病等多种病害的干扰,严重妨碍了葡萄的正常生长,危害产量和质量,为果农的经济带来了损失随着人工智能技术的发展,计算机视觉、图像处理等技术已经广泛应用于农业领域,如水稻病害识别、果蔬品质检测等,这些技术的应用使得农业生产朝着更加智能化和高效化的方向发展 近年来,在农作物病害识别领域,CNN 展现出了优越的性能表现[1-3] 尤其是以单阶段和双阶段目标检测算法为代表的深度学习技术,更是在农业病虫害检测上大展身手,获得了广泛的应用 双阶段目标检测算法首先以候选框的方式确定目标位置,然后再对这些候选框进行分类和回归,其代表模型有Faster-Rcnn 虽然双阶段目标检测算法具备较高准确率,但是在推理速度和部署能力上有所欠缺[4] 单阶段目标检测算法是直接从图像中提取物体的位置和类别信息,不需要进行物体候选框的生成。

      其中比较著名的算法有YOLO[5-6]和SSD 等 YOLO 使用卷积神经网络来提取目标特征,最终将提取到的信息转化为回归问题,SSD 也采用类似的思路综上,本文采用YOLOv7 目标检测算法为基础模型,在此基础上,通过重新设计锚框以适应葡萄叶病斑数据集 并且在模型颈部添加GAM 注意力机制来获取更丰富的跨通道信息,提高模型的特征提取能力 针对密集且具有粘连性质的葡萄叶病斑,将原始YOLOv7 中的NMS 极大值抑制策略更换为对密集目标更敏感的柔性极大值抑制策略Soft-NMS[7] 在公开数据集PlantVillage 上对3 种常见葡萄叶病斑进行识别,以验证模型效果1 YOLOV7 模型简介YOLOv7 网络模型主要包含了输入(Input)、骨干网络(Backbone)、颈部(Neck)、头部(Head)等4部分,其结构图如图1 所示图1 YOLOv7 网络结构Fig. 1 YOLOv7 network structure骨干网络模块由多个卷积层组成,包括BConv卷积层、E-ELAN 卷积层和MPConv 卷积层 其中BConv 卷积层由卷积层、BatchNormalization (BN)层和LeakyReLU 激活函数构成,用于提取不同尺度的图像特征;E-ELAN 卷积层采用原始的ELAN[8]设计架构,引导不同特征组的计算块学习更多样化的特征,提高网络的学习能力,而不破坏原有梯度路径;MPConv 卷积层在BConv 层的基础上,通过添加Maxpool 层, 形成上下两个分支, 上分支通过Maxpool 将图像长宽减半,通过BConv 层将图像通道减半。

      下分支则通过第一个BConv 层将图像通道减半 两个分支提取到的特征经过Cat 操作融合,旨在进一步优化卷积层的效果,提高了网络的特征提取能力头部模块采用路径聚合特征金字塔网络[9](Path Aggregation Feature Pyramid Network,PAFPN)结构,引入自底向上的路径,使得底层信息更容易传递到高层,从而实现了不同层次特征的高效融合Prediction 模块通过REP(RepVGG Block)结构对PAFPN 输出的P3 、P4 和P5 等3 个不同尺度的特征进行图像通道数调整,最后经过1×1 卷积用于置信度、类别和锚框的预测 虽然YOLOv7 算法在常见任务场景(如行人、车辆检测)中表现出色,但将其直接应用于葡萄叶病斑检测仍然存在许多问题,如:(1)受生长时间影响,葡萄叶病斑存在出现位置随机、病斑尺寸不一等问题;有的病斑像素很小,容易产生漏检情况2)不同种类的病斑存在一定相似度 以黑腐病和黑麻疹为例,叶枯病病斑初期症状与黑腐病类似,系统很容易把像素相对较低的黑腐病误识为叶枯病3)个别种类的病斑还存在粘连性,容易在视觉上造成一种不属于任何一类病斑的效果。

      针对这3 种问题,本文从检测锚框、注意力机制、极大值抑制3 方面对YOLOV7 进行改进2 改进YOLOV7 模型2.1 GAM 注意力机制全局注意力机制(Global Attention Mechanism,GAM)[10],可以起到减少网络信息缩减并放大全局维度交互特征的作用 该机制在CBAM 中的顺序通道-空间注意机制的基础上,对其子模块进行了优化设计,整体模块如图2 所示图2 Gam 注意力机制Fig. 2 GAM attention mechanism其中,输入特征由F1表示,将图2 中的一系列中间操作定义为中间状态F2,输出状态定义为F3,则三者之间的关系如公式(1) 所示:2.1.1 通道注意力子模块如图3 所示,原始输入特征F1维度为C×W×H,通道注意力子模块首先对其进行三维通道置换,将信息保存为W×H×C的形式;利用一个两层的MLP,第一层进行编码操作将通道数C缩减至C/R,第二层进行解码操作以获取与输入特征具有相同通道数的结果 最终,通过对结果进行Sigmoid激活函数处理,得到权重系数Mc,可以有效地扩大跨维通道空间的依赖性图3 通道注意力Fig. 3 Channel attention2.1.2 空间注意力子模块:如图4 所示,输入特征F2采用了双重卷积,每个卷积层都使用了7∗7 的卷积核,以达到空间信息融合的效果。

      通道注意力子模块根据特征的重要性进行缩减并得到缩放后的新特征 最后,对于这个特征的权重系数MS,采用Sigmoid激活函数进行处理,以获得更加准确的权重值图4 空间注意力Fig. 4 Spatial attention2.2 柔性非极大值抑制算法在使用YOLO 模型进行检测时,一张图片可能会产生多个候选框,每个候选框代表着可能存在的目标区域 然而,由于算法本身的不确定性,会导致同一个目标在不同的候选框中多次出现 非极大值抑制(Non-Maximum Suppression,NMS)是目标检测领域用于消除重叠的边界框或者其他类型区域的一种策略 其基于一定的规则,通过筛选出最优的检测结果来消除冗余的候选框NMS 的主要思想,是对于所有候选框计算其得分(例如置信度分数),并选择得分最高的框作为输出 然后,将与该框高度重叠的所有候选框从集合中删除 通过不断重复这个过程,直到集合中不存在重叠的候选框 具体见公式(2)式中:M代表当前置信度最高的边界框,bi代表邻域内的相邻边界框,Si是当前边界框得分值,IoU代表两个边界框的阈值,Nt代表该边界框的阈值NMS 在对相邻边界框进行处理时,会判断M和bi的IoU阈值是否小于Nt,如果小于,则保持Si不变,否则就设置为0。

      这种处理方式对于稀疏目标的识别效果很好 然而,个别种类病斑(如黑麻疹)存在密集粘连情况,此时NMS 方法会让两个检测框之间产生抑制效果,从而导致置信度较低的目标漏检为解决上述问题,本文使用一种将得分和重合度全部纳入考虑的非极大值抑制方法Soft -NMS[11] 该方法不会直接剔除置信度较低检测框,而是以权重衰减的方式决定置信度较低的检测框的去留,特别适用于密集目标检测 具体操作如式(3)所示 当重叠度小于给定阈值时,分类置信度分数保持不变;而当重叠度大于等于给定阈值时,分类置信度分数按线性规则进行衰减2.3 锚框重设YOLOv7 模型的每个检测头都可以产生3 个初始锚框,这些锚框是通过对COCO 数据集进行kmeans 聚类生成的,适用于该数据集中常见类别的查找 然而,在葡萄叶病斑数据集小目标以及密集病斑较多时,原始锚框并不适用于该数据集 因此本文采用K-means 聚类算法,对葡萄叶病斑数据集重新进行锚框设计如图5 所示,K 均值(K-means)算法是一种无监督学习算法,用于将数据集划分为K个不同的组或簇,其基本思想是通过最小化数据点与其所属簇中心点之间的距离,来确定数据点所属的簇。

      K 均值算法的基本实现步骤如下:图5 K-means 聚类Fig. 5 K-means clustering(1)初始化簇中心点:随机选择K个数据点作为初始簇中心点2)分配数据点到最近的簇:对于每个数据点,计算其与每个簇中心点之间的距离,并将其分配给距离最近的簇3)重新计算簇中心点:对于每个簇,计算其所有数据点的平均值,并将平均值作为新的簇中心点4)重复步骤(2)、步骤(3),直到簇中心点不再改变或达到最大迭代次数5)输出结果:输出聚类结果,即每个数据点所属的簇3 实验3.1 数据集本节所用数据集分为两部分,一部分来源于网络爬取,另一部分来自于大型公开植物病害数据集PlantVillage,PlantVillage 数据集由植物病理学家对叶片病害进行确诊后得到的,具有权威性 实验选取的3 种常见葡萄叶片病害分别为黑腐病、叶枯病和黑麻疹,具体病斑特征如图6 所示图6 不同病斑图像Fig. 6 Images of different diseases上述数据集共包含葡萄叶病斑图像2 400 张,其中黑麻疹、黑腐病、叶枯病各为800 张 本文使用Labellmg 标注软件进行葡萄叶病斑的标注工作,将图像中不同类型病斑目标的位置进行标注后,将数据集按照训练集∶验证集=8 ∶2 的比例随机划分,并构建VOC 格式的数据集。

      3.2 评价指标精确率(Precision,P) 是指在所有检测出的目标中检测正确的概率,故其又称查准率;召回率(Recall,R) 是度量分类模型性能的一种指标,用来衡量模型在所有正类样本中,正确识别出的样本数量与所有正类样本数量的比例;平均精度(Average Precision,AP) 是衡量模型在检测目标时准确性的一种指标,其是在不同置信度阈值下计算的精度得分的平均值;mAP是从类别的维度对AP进行平均,因此可以评价多分类器的性能 各评价指标的计算公式如下:3.3 实验环境及结果本文采用PyTorch 作为深度学习框架,操作系统选用Ubuntu18.04,显卡为NVIDIA GeForce RTX 2060 6 G,CUDA 版本11.1.0 批次大小设置为16,采用SGD 作为优化器,初始学习率为0.01,动量参数为0.9,经过200 轮次迭代后模型趋于收敛YOLOv7 算法改进前后的mAP对比曲线如图7所示 由此可见,原始YOLOv7 算法在3 种葡萄叶病斑上的检测mAP为0.841,改进后达到了0.872,mAP提高3.1 个百分点图7 改进前后mAP 曲线Fig. 7 Improved front and rear mAP curves of YOLOv73.4 对比实验为验证改进模型在葡萄叶片病斑检测上的优势,在同一数据集上分别选用了主流目标检测模型与改进YOLOv7 模型进行对比。

      图8 展示了目标检测模型Faster-rcnn、RetinaNet、SSD 与改进YOLOv7 在同一数据集上的检测效果,不同模型检测数据详见表1表1 不同检测模型对比Tab. 1 Different Model comparison图8 不同模型检测效果对比Fig. 8 Comparison of detection effects of different models可以看出,对于叶枯病这一种类病斑4 种模型都表现出了较高的定位准确度和置信度水平 该类病斑虽然尺寸各异,但是特征差异化小,模型拟合。

      点击阅读更多内容
      猜您喜欢
      2024年度山东省德州市禹城市乡镇中医执业助理医师考试之中医临床医学考前冲刺试卷B卷含答案.docx 小学劳动教育中劳动清单制度的探索与实践.docx 民国时期报刊术语研究-以LiteraryCriticism(文学批评)为例.docx 2024年度山东省潍坊市安丘市乡镇中医执业助理医师考试之中医临床医学测试卷(含答案).docx 基于改进YOLOv4风机叶片缺陷检测方法.docx 关于服务的承诺书范文(31篇).docx 2021-2022年度湖南省邵阳市正骨医院护士招聘自测模拟预测题库.docx 《儿子们》教案.doc 2024年度广西壮族自治区钦州市钦北区乡镇中医执业助理医师考试之中医临床医学题库练习试卷B卷附答案.docx 2024年度广西壮族自治区玉林市容县乡镇中医执业助理医师考试之中医临床医学考前冲刺试卷B卷含答案.docx 基于时频分析的跳频信号参数估计研究.docx 查干诺尔渔场水域浮游生物及水质调查报告.docx 钢琴曲《山丹丹开花红艳艳》演奏教学的实践和探索.docx 2024年度广西壮族自治区百色市田林县乡镇中医执业助理医师考试之中医临床医学自我检测试卷A卷附答案.docx 2021-2022年度湖南省郴州市郴州铁路医院护士招聘模考预测题库(夺冠系列).docx 关于消防安全演讲稿(31篇).docx 2024年度江苏省乡镇中医执业助理医师考试之中医临床医学模拟考核试卷含答案.docx 2024年度广西壮族自治区河池市东兰县乡镇中医执业助理医师考试之中医临床医学押题练习试卷B卷附答案.docx 2024年度江苏省宿迁市泗洪县乡镇中医执业助理医师考试之中医临床医学考前冲刺模拟试卷B卷含答案.docx 中班社会小鬼当家教案反思.doc
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.