一种基于轻量YOLOv7的人员操作行为识别方法与流程

专利2025-04-05  21


本发明属于新一代信息,具体涉及一种基于轻量yolov7的人员操作行为识别方法。


背景技术:

1、随着我国工业化逐渐推进,工业生成趋向自动化与智能化。由于工业设备操作人员行为不规范导致的工业安全事故时有发生。普通的记录仪只能记录工业设备操作人员的行为,无法起到提醒规范人员安全操作工业设备的作用。

2、现有技术中有专利号为cn202310966210.5,名称为《一种基于自适应改进yolov7网络载体巡检车的检测方法》的中国发明专利申请,其公开了一种基于自适应改进yolov7网络载体巡检车的检测方法,包括以下步骤:1)利用构建智能平台与人机交互,摄像头输入端连接开发版输出端,云端服务器连接手机app,检测云端服务器信号并记录数据;2)操作人员采用人脸解锁巡检车,系统采集并记录数据;3)巡检车启动跟随模式,其距离获取装置设置于车体前方,用于感知距离和方位;4)训练改进后的yolov7模型,使用该模型识别违规操作与产品,输出通过显示器与手机app显示;5)通过识别结果,对劣质产品完成自主分类,并自主导航制打包点,由专员进行打包工作,巡逻车完成分配的任务后,自动巡航到指定的停车点。但是上述专利并不是基于轻量yolov7,这样会导致模型参数量和计算消耗过多,不能在嵌入式设备上稳定运行。


技术实现思路

1、针对现有技术存在的上述问题,本发明提出了一种基于轻量yolov7的人员操作行为识别方法。

2、为实现上述效果,本发明采取的技术方案如下:

3、一种基于轻量yolov7的人员操作行为识别方法,包括如下步骤:

4、s1、收集制作或选取人员操作行为识别数据集;

5、s2、构建包括dscbs模块、注意力机制模块、dsc_elan模块的轻量yolov7网络;

6、s3、将yolov7网络部署至嵌入式设备;

7、s4、将所述嵌入式设备用于人员操作行为识别。

8、进一步地,步骤s1中收集制作或选取的人员操作行为识别数据集包含常见人员操作行为,所述常见人员操作行为包括工业设备操作人员正常操作、侧视、喝水、吸烟、操作中控、看手机、侧身拿东西、整理仪容和接电话。

9、进一步地,步骤s2中dscbs模块将替换原yolov7网络中除了第一个3×3卷积层的所有cbs模块;注意力机制模块将替换原yolov7主干神经网络的第三个cbs模块;dsc_elan模块将替换原yolov7模块中的所有elan模块,最终得到轻量yolov7网络。

10、进一步地,步骤s2中dscbs模块包含深度可分离卷积、标准化层、silu激活函数层,各层依次连接。

11、更进一步地,silu激活函数的公式为:

12、

13、其中x为输入内容,e为自然常数。

14、进一步地,步骤s2中,轻量yolov7中的注意力机制模块具有两个分支,分别为空间注意力机制模块和通道注意力机制模块。

15、更进一步地,所述空间注意力机制模块中,输入的特征图张量矩阵cin∈rh,w,c其中h为特征图的高,w为特征图的宽,c为特征图的通道数,r为实数域;对输入的特征图分别进行三次3×3卷积操作,得到三个输出特征图,再将这三个特征图的维度进行变形,得到的三个输出特征图记作qs、ks、vs,其中qs∈rh×w,c,ks∈rh×w,c,vs∈rh×w,c,最后通过注意力机制计算公式:

16、

17、其中q(query)代表注意力机制中的查询向量,k(key)代表注意力机制中的关键向量,v(value)代表注意力机制中的数值向量,分别对应上述特征图qs,ks,vs;dk为特征图矩阵乘积qkt的标准差;

18、softmax函数的公式为:

19、

20、式中xi表示第i个输入变量,n表示n个输入变量。

21、更进一步地,所述通道注意力机制模块中,输入的特征图张量矩阵cin∈rh,w,c其中h为特征图的高,w为特征图的宽,c为特征图的通道数,对输入的特征图分别进行三次维度进行变形,得到的三个输出特征图qc、kc、vc,其中qc∈rc,h×w,kc∈rc,h×w,vc∈rc,h×w,最后通过注意力机制计算公式:

22、

23、其中q(query)代表注意力机制中的查询向量,k(key)代表注意力机制中的关键向量,v(value)代表注意力机制中的数值向量,分别对应上述特征图qs,ks,vs;dk为特征图矩阵乘积qkt的标准差;

24、softmax函数的公式为:

25、

26、式中xi表示第i个输入变量,n表示n个输入变量。

27、进一步地,轻量yolov7中的dsc_elan模块具有两个分支,其中一个分支经过1×1的卷积层;另一个分支分别由1×1的卷积层,4个dscbs模块依次连接,最后将两个分支的输出结果拼接在一起,再经过一个1×1的卷积层。

28、进一步地,步骤s3中嵌入式设备支持pytorch深度学习框架。

29、进一步地,步骤s3具体为:采用pyqt框架开发人员操作行为识别系统,将训练好的轻量yolov7网络部署至软件系统中,系统包含图像处理功能模块、目标检测功能模块、行为分类功能模块和异常反馈功能模块,处理步骤如下:

30、s31、在图像处理功能模块中,启动基于轻量yolov7工业操作人员行为识别系统后,用户可以采用离线图片、视频文件或在线摄像头实时获取视频图像的方式,将图像显示于程序用户界面,将图像处理为轻量yolov7要求的数据维度为(640,640,3)rgb格式,并传入行为识别模块以便进行行为识别处理;

31、s32、获取到的图像经过目标检测功能模块进行定位,一旦判别为工业设备操作人员位置,则完成行为识别,输出行为类别数据(0-8)及目标位置元组数据(x,y,w,h)与置信度分数,然后将数据传递至行为分类功能模块,进行工业设备操作人员行为分类;

32、s33、行为分类功能模块对获得的行为字典数据进行后处理,提取最大置信度分数的标签,将该行为区分为正常操作与异常操作行为两大类,并将数据传递至异常行为反馈功能模块,进行风险评估;

33、s34、异常行为反馈功能模块接收工业设备操作人员行为分类功能模块的输出,会根据相应的预设规则进行风险评估,触发相应的警示反馈机制,在用户界面予以显著标识,记录该异常行为作为日志或者将数据发送给远程服务器进行进一步处理。

34、本发明取得的技术效果为:

35、本技术设计了一个能在嵌入式设备上高效运行的yolov7网络来识别工业设备操作人员的行为,以规范工业设备操作人员的行为来减少危险操作行为导致的工业事故发生频率。

36、本技术设计了一个轻量yolov7网络,并能在嵌入式设备上高效运行,改进的网络具有相比原yolov7网络更少的参数量和计算消耗,可满足对实时性有要求的应用场景。

37、本技术采用了深度可分离卷积神经网络技术,设计了dscbs,dsc_elan的高效网络模块,相比传统yolov7模块,在保证运行性能的同时,具有更少的参数量和计算消耗。

38、本技术基于轻量yolov7,通过使用一些轻量化的网络结构模块去替换原yolov7的模块,来达到减少yolov7模型参数量和计算消耗,使其能在嵌入式设备上稳定高效的运行。


技术特征:

1.一种基于轻量yolov7的人员操作行为识别方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种基于轻量yolov7的人员操作行为识别方法,其特征在于,步骤s1中收集制作或选取的人员操作行为识别数据集包含常见人员操作行为,所述常见人员操作行为包括工业设备操作人员正常操作、侧视、喝水、吸烟、操作中控、看手机、侧身拿东西、整理仪容和接电话。

3.根据权利要求1所述的一种基于轻量yolov7的人员操作行为识别方法,其特征在于,步骤s2中dscbs模块将替换原yolov7网络中除了第一个3×3卷积层的所有cbs模块;注意力机制模块将替换原yolov7主干神经网络的第三个cbs模块;dsc_elan模块将替换原yolov7模块中的所有elan模块,最终得到轻量yolov7网络。

4.根据权利要求3所述的一种基于轻量yolov7的人员操作行为识别方法,其特征在于,步骤s2中dscbs模块包含深度可分离卷积、标准化层、silu激活函数层,各层依次连接。

5.根据权利要求4所述的一种基于轻量yolov7的人员操作行为识别方法,其特征在于,silu激活函数的公式为:

6.根据权利要求3所述的一种基于轻量yolov7的人员操作行为识别方法,其特征在于,步骤s2中,轻量yolov7中的注意力机制模块具有两个分支,分别为空间注意力机制模块和通道注意力机制模块。

7.根据权利要求6所述的一种基于轻量yolov7的人员操作行为识别方法,其特征在于,所述空间注意力机制模块中,输入的特征图张量矩阵cin∈rh,w,c其中h为特征图的高,w为特征图的宽,c为特征图的通道数,r为实数域;对输入的特征图分别进行三次3×3卷积操作,得到三个输出特征图,再将这三个特征图的维度进行变形,得到的三个输出特征图记作qs、ks、vs,其中qs∈rh×w,c,ks∈rh×w,c,vs∈rh×w,c,最后通过注意力机制计算公式:

8.根据权利要求6所述的一种基于轻量yolov7的人员操作行为识别方法,其特征在于,所述通道注意力机制模块中,输入的特征图张量矩阵cin∈rh,w,c其中h为特征图的高,w为特征图的宽,c为特征图的通道数,对输入的特征图分别进行三次维度进行变形,得到的三个输出特征图qc、kc、vc,其中qc∈rc,h×w,kc∈rc,h×w,vc∈rc,h×w,最后通过注意力机制计算公式:

9.根据权利要求3所述的一种基于轻量yolov7的人员操作行为识别方法,其特征在于,轻量yolov7中的dsc_elan模块具有两个分支,其中一个分支经过1×1的卷积层;另一个分支分别由1×1的卷积层,4个dscbs模块依次连接,最后将两个分支的输出结果拼接在一起,再经过一个1×1的卷积层。

10.根据权利要求1所述的一种基于轻量yolov7的人员操作行为识别方法,其特征在于,步骤s3中嵌入式设备支持pytorch深度学习框架,采用pyqt框架开发人员操作行为识别系统,将训练好的轻量yolov7网络部署至软件系统中,系统包含图像处理功能模块、目标检测功能模块、行为分类功能模块和异常反馈功能模块,处理步骤如下:


技术总结
本发明属于新一代信息技术领域,具体涉及一种基于轻量YOLOv7的人员操作行为识别方法,包括如下步骤:S1、收集制作或选取人员操作行为识别数据集;S2、构建包括DSCBS模块、注意力机制模块、DSC_ELAN模块的轻量YOLOv7网络;S3、将YOLOv7网络部署至嵌入式设备;S4、将所述嵌入式设备用于人员操作行为识别。本申请设计了一个能在嵌入式设备上高效运行的YOLOv7网络来识别工业设备操作人员的行为,以规范工业设备操作人员的行为来减少危险操作行为导致的工业事故发生频率。

技术研发人员:刘书舟,绳大为,王正杰,田军,施伟杰
受保护的技术使用者:东方电气集团科学技术研究院有限公司
技术研发日:
技术公布日:2024/12/17
转载请注明原文地址:https://xbbs.6miu.com/read-23133.html