一种用于多人跟踪的行为识别方法、装置、服务器及系统

专利2025-04-17  17


本发明涉及隐私保护智能监控,尤其涉及一种用于多人跟踪的行为识别方法、装置、服务器及系统。


背景技术:

1、由于更好的生活质量和医疗保健改进标准,人们的平均预期寿命正在持续增加。在这一趋势下,老年人群体的数量将会快速增加。由于护理人员的稀缺和持续增长的老年人的数量之间的矛盾,老年人的照顾可能会成为如今社会的一个大问题。在日常生活中,老人非常容易出现各种各样的意外事件,比如跌倒等,尽早的检测跌倒对于老人的健康至关重要,如果在发生摔倒事件时,老人身旁无人照看,没有及时的对老人进行救治,就可能会对老人的身体产生严重的损害甚至威胁生命安全,在发现跌倒和提供医疗帮助方面稍有延迟就可能致命,如果一个人在跌倒后躺在地板上超过1小时,那么他在跌倒后6个月内死亡的几率为50%。因此,在居家环境中使用现有智能技术及时对老人的异常行为状态进行检测、预测和警报非常重要,可以有效的改善养老行业的服务质量,为老人的安全提供更加坚固的保障。

2、近年来,随着计算机视觉和人工智能的飞速发展,一种基于机器视觉的行为识别技术逐步进入人们的视野。行为识别在计算机视觉领域中逐渐成为一个越来越热门的研究方向,行为识别主要用于对目标场景中的人类行为进行理解分析并准确识别出人类的行为,计算机视觉领域的行为识别主要是通过摄像头采集图片或者视频等视觉数据,然后通过对视觉数据进行特征提取,对所提取的特征进行一系列后处理后来实现检测人类正在进行的行为的功能。现代人工智能,特别是深度学习对这类任务非常有效。深度学习也因其通用性而广受欢迎,一个训练好的模型,可以用来处理各种不同的问题,例如人机交互系统,训练好的行为识别模型可以对此类智能化的终端系统提供必要的基础知识。以往的人机交互一般需要根据人的指令做出相应的反应,这就要求人对一些输入设备如键盘、鼠标等进行直接的接触来传递信息给机器,机器往往处于被动地位,无法充分发挥主动性,而行为识别技术则可以实现让机器理解人的行为,并根据人的行为做出相应的反应。

3、但是随着基于计算机视觉的人工智能技术的普及,各种各样的图像数据被采集并应用于深度学习技术中,在这一过程中,包含家庭信息和生活场景信息的数据可能被泄露,在对老年人进行基于计算机视觉的非侵入式行为识别时,隐私问题尤为突出,老年人作为社会中的一个特殊群体,他们的隐私更需要得到保护,进行隐私保护下基于计算机视觉的老年人行为识别研究是非常必要的。另外,针对多人的行为识别也是亟需解决的技术难题。


技术实现思路

1、本技术实施例通过提供了一种用于多人跟踪的行为识别方法、装置、服务器及系统,能够在保护运动目标所处环境隐私的前提下,区分出不同的行为个体,实现对多个体的行为状态识别,有利于保障被识别人的隐私保护的同时,提高了运动目标的异常行为识别的准确性。

2、第一方面,本发明通过本发明的一实施例提供如下技术方案:

3、一种用于多人跟踪的行为识别方法,应用于服务器,所述方法包括:

4、获取视频序列,对所述视频序列进行前景和背景分割,得到前景图像和背景图像,所述前景图像为包含运动目标的图像;对所述背景图像进行模糊处理,并与所述前景图像进行融合,得到目标图像,并执行以下跟踪步骤:从所述目标图像中提取出待处理的当前视频帧,识别出所述当前视频帧中的每个运动目标,针对每个运动目标分别创建一个轨迹条目;计算当前视频帧中每个运动目标的检测轨迹与当前视频帧中所有运动目标的预测轨迹之间的交并比,并根据交并比构建一个代价矩阵,其中,所述预测轨迹为当前视频帧的上一视频帧时采用卡尔曼滤波器对每个运动目标在下一视频帧中的轨迹进行预测得到的;利用匈牙利匹配算法对所述代价矩阵进行优化,寻找出所有运动目标的检测轨迹与预测轨迹之间总代价最小的匹配方案,基于所述匹配方案优化每个运动目标的匹配,并基于匹配结果使用卡尔曼滤波器进行运动目标轨迹的更新,将更新后的轨迹存放进相应的轨迹条目下,重复执行所述跟踪步骤,直至得到每个运动目标在整个视频序列下的跟踪结果;根据所述每个运动目标在整个视频序列的跟踪结果,对每个运动目标的异常行为进行识别。

5、优选地,所述针对每个运动目标分别创建一个轨迹条目之后,还包括:将当前视频帧中所有运动目标初始状态下的轨迹均标记为未确认的轨迹;所述基于匹配结果使用卡尔曼滤波器进行运动目标轨迹的更新,包括:若存在运动目标的检测轨迹与预测轨迹成功匹配,则使用卡尔曼滤波器对该运动目标的轨迹进行更新;若存在运动目标的检测轨迹与预测轨迹匹配失败,且该运动目标的轨迹为未确认的轨迹,则将该运动目标的轨迹进行删除。

6、优选地,若存在运动目标的检测轨迹与预测轨迹成功匹配,则使用卡尔曼滤波器对该运动目标的轨迹进行更新之后,还包括:若在连续三个视频帧下存在运动目标的检测轨迹与预测轨迹成功匹配,则将该运动目标匹配后的所有检测轨迹均标记为已确认的轨迹;所述基于匹配结果使用卡尔曼滤波器进行运动目标轨迹的更新,还包括:若存在运动目标的检测轨迹与预测轨迹匹配失败,且该运动目标的轨迹为已确认的轨迹,则在连续预设次数未匹配后将该运动目标的轨迹进行删除。

7、优选地,所述基于匹配结果使用卡尔曼滤波器进行运动目标轨迹的更新之后,还包括:提取每个运动目标的外观特征;针对每个运动目标,将运动目标的外观特征、运动目标的检测轨迹以及运动目标的预测轨迹进行级联匹配;若级联匹配成功,则基于级联匹配结果使用卡尔曼滤波器进行运动目标轨迹的更新。

8、优选地,所述方法还包括:若级联匹配失败,则将未确认的轨迹或匹配失败的轨迹与未匹配的运动目标进行交并比匹配,构建一个新的代价矩阵;将新的代价矩阵输入匈牙利算法,得到线性匹配结果;若线性匹配成功,则基于线性匹配结果使用卡尔曼滤波器进行运动目标轨迹的更新。

9、优选地,所述对所述视频序列进行前景和背景分割,包括:将视频序列输入进yolov8-seg网络模型中,得到人体图像的掩码;基于人体图像的掩码以及视频序列,提取出前景图像和背景图像。

10、优选地,所述基于人体图像的掩码以及视频序列,提取出前景图像和背景图像,包括:将人体图像的掩码与视频序列进行与操作,得到前景图像,其中,所述人体图像的掩码中人体部分的像素值为1,除人体外的其他部分的像素值为0;对所述人体图像的掩码进行取反操作,得到背景图像的掩码,将所述背景图像的掩码与所述视频序列进行与操作,得到背景图像,其中,所述背景图像的掩码中人体部分的像素值为0,除人体外的其他部分的像素值为1。

11、第二方面,本发明通过本发明的一实施例,提供如下技术方案:

12、一种用于多人跟踪的行为识别装置,应用于服务器,所述装置包括:

13、图像分割模块,用于获取视频序列,对所述视频序列进行前景和背景分割,得到前景图像和背景图像,所述前景图像为包含运动目标的图像;

14、融合模块,用于对所述背景图像进行模糊处理,并与所述前景图像进行融合,得到目标图像,并执行以下跟踪步骤:从所述目标图像中提取出待处理的当前视频帧,识别出所述当前视频帧中的每个运动目标,针对每个运动目标分别创建一个轨迹条目;

15、匹配模块,用于计算当前视频帧中每个运动目标的检测轨迹与当前视频帧中所有运动目标的预测轨迹之间的交并比,并根据交并比构建一个代价矩阵,其中,所述预测轨迹为当前视频帧的上一视频帧时采用卡尔曼滤波器对每个运动目标在下一视频帧中的轨迹进行预测得到的;

16、轨迹更新模块,用于利用匈牙利匹配算法对所述代价矩阵进行优化,寻找出所有运动目标的检测轨迹与预测轨迹之间总代价最小的匹配方案,基于所述匹配方案优化每个运动目标的匹配,并基于匹配结果使用卡尔曼滤波器进行运动目标轨迹的更新,将更新后的轨迹存放进相应的轨迹条目下,重复执行所述跟踪步骤,直至得到每个运动目标在整个视频序列下的跟踪结果;

17、行为识别模块,用于根据所述每个运动目标在整个视频序列的跟踪结果,对每个运动目标的异常行为进行识别。

18、第三方面,本发明通过本发明的一实施例,提供如下技术方案:

19、一种服务器,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现前述第一方面中任一项所述方法的步骤。

20、第四方面,本发明通过本发明的一实施例,提供如下技术方案:

21、一种用于多人跟踪的状态识别系统,包括:视觉传感器以及如前述第三方面所述的服务器,所述视觉传感器与所述服务器通讯连接,用于向所述服务器发送视频序列。

22、本技术实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:

23、本发明实施例提供的用于多人跟踪的行为识别方法,先对视频帧中的视频序列进行前景和背景分割,对背景图像进行模糊处理,再与前景图像进行融合,得到仅包含前景的目标原图像,由于画面中可能出现多个人,因此将识别到的每个运动目标分别创建一个轨迹条目;然后,计算每一个运动目标的检测轨迹和所有运动目标的预测轨迹之间的交并比iou,并把它们的iou值列为一个代价矩阵,再对代价矩阵进行优化,匹配方案包括每个运动目标的检测轨迹与预测轨迹之间的匹配关系,基于匹配结果对运动目标轨迹进行更新,最后得到每个运动目标在整个视频序列下的跟踪结果,对每个运动目标的异常行为进行识别。该方法先对视频序列进行背景模糊处理,再对背景模糊处理后的运动目标轨迹进行跟踪,可以在防止背景干扰的情况下,实现较准确地识别出每个运动目标的异常行为,保证老人的安全,基于隐私保护计算机视觉技术的行为识别方法,可满足老人家庭环境的隐私保护和居家安全的需求。


技术特征:

1.一种用于多人跟踪的行为识别方法,其特征在于,应用于服务器,所述方法包括:

2.如权利要求1所述的方法,其特征在于,所述针对每个运动目标分别创建一个轨迹条目之后,还包括:

3.如权利要求2所述的方法,其特征在于,若存在运动目标的检测轨迹与预测轨迹成功匹配,则使用卡尔曼滤波器对该运动目标的轨迹进行更新之后,还包括:

4.如权利要求2所述的方法,其特征在于,所述基于匹配结果使用卡尔曼滤波器进行运动目标轨迹的更新之后,还包括:

5.如权利要求4所述的方法,其特征在于,还包括:

6.如权利要求1所述的方法,其特征在于,所述对所述视频序列进行前景和背景分割,包括:

7.如权利要求6所述的方法,其特征在于,所述基于人体图像的掩码以及视频序列,提取出前景图像和背景图像,包括:

8.一种用于多人跟踪的状态识别装置,其特征在于,应用于服务器,所述装置包括:

9.一种服务器,其特征在于,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现权利要求1-8中任一项所述方法的步骤。

10.一种用于多人跟踪的状态识别系统,其特征在于,包括:视觉传感器以及如权利要求9所述的服务器,所述视觉传感器与所述服务器通讯连接,用于向所述服务器发送视频序列。


技术总结
本发明公开了一种用于多人跟踪的行为识别方法、装置、服务器及系统,方法包括:获取视频序列,对视频序列进行前景和背景分割;对背景图像进行模糊处理,与前景图像进行融合,得到目标图像,并执行以下跟踪步骤:从目标图像中提取出待处理的当前视频帧,识别出当前视频帧中的每个运动目标;计算当前视频帧中每个运动目标的检测轨迹与当前视频帧中所有运动目标的预测轨迹之间的交并比,根据交并比构建一个代价矩阵;对代价矩阵进行优化,寻找出总代价最小的匹配方案,基于匹配方案优化每个运动目标的匹配,进行运动目标轨迹的更新,重复执行跟踪步骤,直至得到每个运动目标在整个视频序列下的跟踪结果,根据跟踪结果对运动目标的异常行为进行识别。

技术研发人员:付艳,沈卫明,黄朝晖,谭宇翔,刘彦诚,朱泽强,刘顺,高正柯,曾一帆
受保护的技术使用者:华中科技大学鄂州工业技术研究院
技术研发日:
技术公布日:2024/12/17
转载请注明原文地址:https://xbbs.6miu.com/read-23528.html