基于改进YOLOv8n-obb的西瓜及其瓜柄识别方法

专利2025-06-30 48

本发明农业方向的计算机视觉，具体涉及一种基于改进yolov8n-obb的西瓜及其瓜柄识别方法。

背景技术：

1、在西瓜的生产流程中，西瓜的采摘是重要环节之一，需要大量人工参与。但由于存在劳动力短缺和老龄化，以及机械化程度低、重复性劳作等因素，导致采摘工作费时费力。使用采摘机器人可以有效地缓解以上的诸多问题。

2、对于西瓜采摘机器人而言，需要视觉定位的关键信息就是西瓜位置和需要剪切的瓜柄位置，西瓜和瓜柄检测定位的精度直接影响着西瓜采摘机器人的工作质量，因此需要提高识别质量。西瓜识别既需要识别较大目标西瓜，也需要识别小目标瓜柄，而小目标识别存在特征丢失，漏检、误检率高等问题，同时识别西瓜时存在着诸如果实与背景颜色相近、存在叶片遮挡等问题。近年来随着深度学习在计算机视觉领域的发展，基于卷积神经网络的深度学习算法在各大开源的图像数据集上取得了远超传统识别算法的精度。因此为了提升识别效率，选择使用深度学习检测算法来识别西瓜。

3、深度学习算法在目标检测领域可以分为单阶段算法和二阶段算法。相对于二阶段算法，一阶段算法直接从图像中提取目标的类别和位置信息，不需要经历二阶段算法的生成候选框步骤，因此具有计算量较少、检测速度较快的优势，更容易满足在实际应用场景中的实时性需求。现有技术中，yolov8是单阶段算法yolo系列中的一员，具有优异的性能，虽然其能对西瓜进行识别，但仍有改进空间。

技术实现思路

1、为了克服已有技术的不足，本发明提供了一种基于改进yolov8n-obb的西瓜及其瓜柄识别方法，改善存在遮挡时的识别效果，提高精度。

2、本发明解决其技术问题所采用的技术方案是：

3、一种基于改进yolov8n-obb的西瓜及其瓜柄识别方法，包括以下步骤：

4、s1、利用相机在西瓜大棚和西瓜地中采集不同的天气和光照条件下的不同角度的西瓜图像并制作数据集；

5、s2、对yolov8n-obb作为基础模型进行改进得到改进后的模型，过程如下：

6、s21、改进yolov8n-obb模型中backbone部分的c2f模块，结合接受场注意卷积rfaconv设计c2f_rfaconv模块对c2f模块进行替换；

7、s22、改进yolov8n-obb模型中head部分，添加小目标检测层，以获得像素为n×n的特征检测层；

8、s23、改进yolov8n-obb模型中neck部分，添加seam多头注意力网络模块；

9、s3、利用改进后的模型对s1中的数据集进行训练，得到西瓜与瓜柄识别模型并输出.pt格式的权重文件；

10、s4、加载s3中生成的权重文件并将s1中的测试集作为输入图像对西瓜和瓜柄识别模型进行检测，得到西瓜和瓜柄的检测结果。

11、进一步，所述s1中，制作西瓜数据集的过程为：对拍摄的图片进行裁剪；采用rolabelimg标注工具对西瓜及其瓜柄进行手动旋转框标注，对瓜柄进行标注时需要包括瓜蒂部分；标注完成后使用图片翻转、平移、旋转和添加噪声等方式进行数据增强得到数据集；对数据集按7：2：1的比例进行随机划分，得到训练集、验证集和测试集。

12、再进一步，所述s21中，结合接受场注意卷积rfaconv设计c2f-rfaconv模块，过程如下：

13、引入接受场注意卷积rfaconv模块，该模块利用平均池化avgpool来聚合每个接收场特征的全局信息，使用大小为1×1的分组卷积进行信息交互，最后使用归一化指数函数softmax来强调每个特征在接收场特征中的重要性，rfa的计算式如下所示：

14、f＝softmax(g1×1(avgpool(x)))×relu(norm(gn×n(x)))

15、其中，gn×n代表大小为n×n的分组卷积，n表示卷积核的大小，norm表示归一化，x表示输入特征图，relu为激活函数；

16、利用rfaconv模块对原c2f模块中的bottleneck部分的第二个卷积进行替换，得到c2f_rfaconv模块。

17、更进一步，所述s22中，n取160，添加小目标检测层，以获得像素为160×160的特征检测层，在原yolov8n-obb模型的检测头结构前扩增小目标检测层，该层的输出特征图尺寸为160×160像素大小。

18、所述s23中，添加seam多头注意力网络模块，过程如下：seam模块采用通道和空间混合模块csmm来学习不同通道的重要性，采用的csmm模块有三个不同的尺寸，其步长大小由补丁patch大小决定，分别为6、7和8，随后三个模块输出结果并进行平均池化avgpool，并通过通道扩展channel exp操作，最后相乘以提供增强的特征表示；csmm利用不同的补丁进行多尺度特征处理，并使用深度可分离卷积来学习空间维度和通道之间的相关性，再通过逐点卷积进行深度可分离卷积的输出组合；seam模块被添加至yolov8n-obb模型neck部分与head部分所有相连接的位置。

19、所述s4中，西瓜和瓜柄的检测结果包括：西瓜与瓜柄的位置、类别名称和置信度。

20、本发明的技术构思为：以yolov8n-obb作为基础网络模型，通过结合接受场注意卷积rfaconv设计c2f_rfaconv模块对yolov8n-obb模型的backbone部分的c2f模块进行替换，强化了多尺度下模型的空间特征提取能力。同时通过添加小目标检测层，提高模型对瓜柄的识别能力。而通过引入seam多头注意力网络模块，增强了模型对空间维度和通道的细致处理能力，改善了模型对遮挡时的检测效果，增强了模型的适用性。通过上述改进，有效地提升了模型对西瓜和瓜柄的识别精度，特别是提高了模型对存在遮挡时的检测能力，增强了模型的适用性。

21、本发明的有益效果主要表现在：改善存在遮挡时的识别效果，提高精度。

技术特征：

1.一种基于改进yolov8n-obb的西瓜及其瓜柄识别方法，其特征在于，所述方法包括以下步骤：

2.如权利要求1所述的一种基于改进yolov8n-obb的西瓜及其瓜柄识别方法，其特征在于，所述s1中，制作西瓜数据集的过程为：对拍摄的图片进行裁剪；采用rolabelimg标注工具对西瓜及其瓜柄进行手动旋转框标注，对瓜柄进行标注时需要包括瓜蒂部分；标注完成后使用图片翻转、平移、旋转和添加噪声方式进行数据增强得到数据集；对数据集按7：2：1的比例进行随机划分，得到训练集、验证集和测试集。

3.如权利要求1或2所述的一种基于改进yolov8n-obb的西瓜及其瓜柄识别方法，其特征在于，所述s21中，结合接受场注意卷积rfaconv设计c2f-rfaconv模块，过程如下：

4.如权利要求1或2所述的一种基于改进yolov8n-obb的西瓜及其瓜柄识别方法，其特征在于，所述s22中，n取160，添加小目标检测层，以获得像素为160×160的特征检测层，在原yolov8n-obb模型的检测头结构前扩增小目标检测层，该层的输出特征图尺寸为160×160像素大小。

5.如权利要求1或2所述的一种基于改进yolov8n-obb的西瓜及其瓜柄识别方法，其特征在于，所述s23中，添加seam多头注意力网络模块，过程如下：seam模块采用通道和空间混合模块csmm来学习不同通道的重要性，采用的csmm模块有三个不同的尺寸，其步长大小由补丁patch大小决定，分别为6、7和8，随后三个模块输出结果并进行平均池化avgpool，并通过通道扩展channel exp操作，最后相乘以提供增强的特征表示；csmm利用不同的补丁进行多尺度特征处理，并使用深度可分离卷积来学习空间维度和通道之间的相关性，再通过逐点卷积进行深度可分离卷积的输出组合；seam模块被添加至yolov8n-obb模型neck部分与head部分所有相连接的位置。

6.如权利要求1或2所述的一种基于改进yolov8n-obb的西瓜及其瓜柄识别方法，其特征在于，所述s4中，西瓜和瓜柄的检测结果包括：西瓜与瓜柄的位置、类别名称和置信度。

技术总结
一种基于改进YOLOv8n‑obb的西瓜及其瓜柄识别方法，包括以下步骤：S1、利用相机在西瓜大棚和西瓜地中采集不同的天气和光照条件下的不同角度的西瓜图像并制作数据集；S2、以YOLOv8n‑obb作为基础模型进行改进得到改进后的模型；S3、利用改进后的模型对S1中的数据集进行训练，得到西瓜与瓜柄识别模型并输出.pt格式的权重文件；S4、加载S3中生成的权重文件并将S1中的测试集作为输入图像对西瓜和瓜柄识别模型进行检测，得到西瓜和瓜柄的检测结果。本发明改善存在遮挡时的识别效果，提高精度。

技术研发人员：荀一,毛威涛,杨庆华,王志恒
受保护的技术使用者：浙江工业大学
技术研发日：
技术公布日：2024/12/17

转载请注明原文地址:https://xbbs.6miu.com/read-25820.html