本发明涉及生物与新医药,特别是一种基于上颌窦推断性别年龄方法、模型建立方法及系统。
背景技术:
1、个体身份鉴识是法医学的主要研究方向之一,而性别与年龄的推断是其中的重要组成部分。当尸体处于较为极端的情况下,例如化学腐蚀物、火灾、爆炸以及恶性刑事案件时,遗骸常常会变得面目全非,此时如何通过残缺的遗骸来推断性别与年龄进而识别个体身份就变成为一个难题。
2、对于性别推断而言,现已有许多方法能够实现,例如骨骼测量、牙体测量、dna检测。其中,基于dna检测的性别推断方法已被广泛使用。但在一些经济水平相对落后、环境条件相对恶劣的地区,dna检测对设备、样本质量和时间的要求在某些条件下难以满足,检测开展难度大。而在部分案件中,还可能存在无法从尸体残骸中有效提取dna的情况。因此,还需开发更加简便、高效、设备要求更低的检测方法作为常规方法的补充。
3、对于年龄推断而言,目前法医学实践中常用的方法仍然存在提升的空间及优化的必要。利用x线片进行骨龄判断的方法虽然可行性较强,但在成年群体中的准确率相对较低。目前已开发出许多新兴的年龄推断技术,例如根据dna甲基化水平进行年龄估计,根据锁骨胸骨段骨骺分期进行年龄估计等,这些技术虽然都具有较高的准确性,然而在实际应用时往往存在一定的局限性,且在进行成年人年龄推断时误差较大。其中,dna甲基化水平检测需使用专业设备,设备成本较高,锁骨胸骨段骨骺分期需要该专业领域的专家先对组织结构进行准确的分期,这些因素均限制了相关方法的推广应用。
4、骨骼作为人体结构中较为稳定的组织,已有大量研究基于骨骼进行性别与年龄推断。对于性别推断而言,使用头骨和骨盆进行推断准确率超过90%,此外还有一些使用长骨的方法拥有更高的准确性。对于年龄推断而言包括但不限于上述所提到的两种方法,但这些较大的骨骼在开展法医学鉴定时,可能存在完整性无法保证的情况。而在很多情况下,即使其他骨骼结构已经受到了严重的损坏,上颌窦仍然能够保持其完整性,因此上颌窦在法医鉴定中极具潜力。此外已有研究表明上颌窦中的各项线性数据与体积存在性别差异并与年龄线性相关,因此可以通过测量上颌窦的解剖结构进行性别与年龄推断。
5、近年来,随着三维影像技术在医学实践中的逐渐推广,国内外出现了利用计算机断层扫描(computedtomography,ct)、显微ct(micro computed tomography,micro-ct)和锥形束ct(cone beam ct,cbct)技术检测各项骨骼结构用于法医学实践的相关研究。同时,机器学习在医学研究中的应用越来越广泛。例如,使用机器学习拟合回归模型来评估急性肾损伤。还有研究表明机器学习和成像组学之间的相互作用,可以更好地对癌症进行分期。毫无疑问,机器学习在医学研究领域的应用将发挥更重要的作用。
6、目前针对基于上颌窦解剖结构的性别年龄推断,国内外大多数研究均基于双侧上颌窦的线性数据,所得数据不够全面,如果要采集上颌窦的体积,则需要面对所需步骤繁琐的问题,耗费时间长,技术门槛高,且每一例样本的数据分析均需要约2个小时。并且现有研究中的数据获取方法都是通过手动测量,当仅使用较易获得的线性数据时,准确率并不能得到保障,而使用体积等较难获得的数据时,又会在数据采集上花费大量的时间。其次这些研究中的模型均为传统的多元线性回归与逻辑回归模型(logistic),而基于机器学习在模型拟合中的优越性,使用机器学习进行模型的拟合能够获得更高的准确率。此外,现有研究中多数样本量未超过200例,由此拟合出的模型代表性不强,并且由于数据采集方式均为手动测量,一方面增加了工作量与花费的时间,另一方面由不同的测量人员进行测量时的主观性判断以及专业知识水平的差距产生的误差也会影响数据的准确性和稳定性,对于推断结果的准确率同样会造成影响,模型难以投入使用。因此,对于使用上颌窦进行年龄推断而言,几乎没有研究人员尝试使用其作为年龄推断的依据,导致目前在该领域的研究仍存在较大空白。
技术实现思路
1、本发明的目的在于提供一种基于上颌窦推断性别年龄方法、模型建立方法及系统,以解决现有技术中在其他骨骼及剩余组织丧失的情况下,影响法医对尸体性别和年龄作出准确有效判断的问题。
2、为了实现上述目的,本发明采用如下技术方案:
3、本发明公开了一种基于上颌窦推断性别年龄方法,包括:
4、s1、选取预设数量的目标样本,获取所有目标样本的颅骨cbct图像;
5、s2、选取部分目标样本的颅骨cbct图像进行上颌窦的标注和分割,得到标注图像,根据标注图像和部分目标样本未标注的颅骨cbct图像建立自动分割模型;
6、s3、根据自动分割模型对所有未标注的颅骨cbct图像进行上颌窦的自动分割,得到上颌窦分割图像,并通过测量得到所有上颌窦分割图像的各线性数据和体积;
7、s4、将选取的目标样本按预设的年龄区间进行分组,通过测量得到的各项数据与真实性别进行差异性检验,分别得到各年龄区间的性别差异性参数,以及通过测量得到的各项数据与真实年龄进行相关性检验,分别得到各年龄区间的年龄相关性参数;
8、s5、根据各年龄区间的性别差异性参数建立性别推断模型,并根据各年龄区间的年龄相关性参数建立年龄推断模型;
9、s6、将待检测颅骨cbct图像输入自动分割模型得到待检测颅骨cbct图像的上颌窦各线性数据和体积,将上颌窦各项数据分别输入性别推断模型和年龄推断模型进行推断,并分别输出待检测颅骨cbct图像对应的性别和年龄。
10、可选地,所述选取部分目标样本的颅骨cbct图像进行上颌窦的标注和分割的方法包括:
11、将所有目标样本的颅骨cbct图像均导入itk-snap软件中;
12、对选取的部分目标样本的颅骨cbct图像进行逐个调取,并在调取的颅骨cbct图像中为上颌窦存在的每一断层中,使用roi工具手动标注出上颌窦的范围;
13、根据颅骨cbct图像上标注出的上颌窦范围,选择分割工具对调取的颅骨cbct图像进行上颌窦分割,以得到仅包含上颌窦的标注图像;
14、将标注图像和其余未标注的颅骨cbct图像均存储为nii.gz格式备用。
15、可选地,所述根据标注图像和部分目标样本未标注的颅骨cbct图像建立自动分割模型的方法包括:
16、选用基于三维卷积和三维反卷积的vnet架构作为基本模型,建立student训练模型和teacher辅助模型,并在student训练模型的encoder部分和teacher辅助模型的decoder部分之间添加跨层链接的unet架构;
17、从标注图像中提取有标注数据,并使用有标注数据分别训练student训练模型和teacher辅助模型,由teacher辅助模型辅助student训练模型根据有标注数据学习上颌窦的标注特征和分割模式;
18、从未标注的颅骨cbct图像中提取有监督数据,将有监督数据分别输入student训练模型和teacher辅助模型中,由teacher辅助模型辅助student训练模型根据有监督数据进行上颌窦标注和分割的自训练;
19、基于多个网络的co-training,通过student训练模型和teacher辅助模型之间的相互训练,建立自动分割模型。
20、可选地,还包括student训练模型和teacher辅助模型之间相互训练的方法:
21、将有标注数据分别输入student训练模型和teacher辅助模型,student训练模型通过反向传播学习上颌窦的标注特征和分割模式,并通过为teacher辅助模型添加基于mt架构不随反向传播更新的固定参数vnet,由teacher辅助模型使用有标注数据和student模型的ema平均值进行更新,得到具有一定解析度的伪标签;
22、将有监督数据分别输入student训练模型和teacher辅助模型,student训练模型根据有监督数据进行上颌窦标注和分割的自训练,teacher辅助模型对student训练模型的自训练进行条件约束,并通过ema平均更新参数和student训练模型进行一致性检测;
23、将teacher辅助模的伪标签作为新的有监督数据,输入到student训练模型中指导student训练模型进行学习和训练。
24、可选地,还包括在建立自动分割模型之前,对标注图像和未标注的颅骨cbct图像进行数据处理的方法:
25、将标注图像和未标注的颅骨cbct图像整合为数据格式的cbct图像数据,并对不满足预设数据量大小的cbct图像数据进行删除;
26、对删除处理后的所有cbct图像数据,将像素灰度值范围为-1000-2000的cbct图像数据转化为像素灰度值范围为0-255的cbct图像数据,并将所有的cbct图像数据进行归一化处理,以得到int8格式的cbct图像数据;
27、归一化处理后,对所有cbct图像数据的影像进行裁切,得到仅包含上颌窦影像的cbct图像数据;
28、将裁切后得到的cbct图像数据存为h5文件。
29、可选地,所述通过测量得到所有上颌窦分割图像的各线性数据和体积的方法包括:
30、对选取的部分目标样本的颅骨cbct图像进行逐个标注,并在颅骨cbct图像中对上颌窦存在的每一断层中标注出上颌窦的范围;
31、根据自动分割模型分割得到的上颌窦分割图像,在每一个上颌窦分割图像中,对每一断层的连续横断面通过测量分别获取上颌窦的线性长度、线性宽度,以及两上颌窦外侧壁的线性间距,并对每一断层的连续冠状面通过测量获取上颌窦的线性高度;
32、将每一个上颌窦分割图像中在多个断层测量获取的数据进行合并得到对应上颌窦的体积数据。
33、可选地,还包括获取各年龄区间的性别差异性参数和年龄相关性参数的方法:
34、采用shapiro-wilk检验对各年龄区间内所有目标样本对应测量的各项数据进行正态分布检验;
35、若所有目标样本对应测量的各项数据均服从正态分布,将各项测量数据设定为统计学变量,为每一项变量按性别分别绘制山脊图,在每个年龄区间内分别得到和各变量一一对应的山脊图;
36、根据绘制的山脊图,在每个年龄区间内对各变量之间在不同性别上的响应进行可视化,并采用独立样本t检验对不同性别之间的各项测量数据进行差异比较,分别得到各年龄区间内具有性别差异性的参数数据;
37、采用pearson检验评估各项测量数据和对应目标样本真实年龄的线性相关性,并分别得到各年龄区间内具有年龄相关性的参数数据。
38、可选地,还包括性别推断模型和年龄推断模型的建立方法:
39、将所有目标样本按照8:2的比例随机分为训练组和测试组;
40、选择多个预设的回归模型,将训练组中所有目标样本的性别差异性参数分别输入多个回归模型进行性别推断训练,并在模型训练后,将测试组中所有目标样本的性别差异性参数分别输入多个回归模型进行测试评估,根据评估结果判断模型的拟合效能,并确定随机森林模型为性别推断模型;
41、选择多个预设的回归模型,将训练组中所有目标样本的年龄相关性参数分别输入多个回归模型进行年龄推断训练,并在模型训练后,将测试组中所有目标样本的年龄相关性参数分别输入多个回归模型进行测试评估,根据评估结果判断模型的拟合效能,并确定随机森林模型和多元线性回归模型的拟合模型为年龄推断模型。
42、本发明还提供一种模型建立方法,法包括:
43、选取预设数量的目标样本,获取所有目标样本的颅骨cbct图像;
44、选取部分目标样本的颅骨cbct图像进行上颌窦的标注和分割,得到标注图像,根据标注图像和部分目标样本未标注的颅骨cbct图像建立自动分割模型;
45、根据自动分割模型对所有未标注的颅骨cbct图像进行上颌窦的自动分割,得到上颌窦分割图像,并通过测量得到所有上颌窦分割图像的各线性数据和体积;
46、将选取的目标样本按预设的年龄区间进行分组,通过测量得到的各项数据与真实性别进行差异性检验,分别得到各年龄区间的性别差异性参数,以及通过测量得到的各项数据与真实年龄进行相关性检验,分别得到各年龄区间的年龄相关性参数;
47、根据各年龄区间的性别差异性参数建立性别推断模型,并根据各年龄区间的年龄相关性参数建立年龄推断模型。
48、本发明还提供一种推断系统,包括:
49、样本筛选模块,用于选取预设数量的目标样本,获取所有目标样本的颅骨cbct图像;
50、自动分割模型建立模块,用于选取部分目标样本的颅骨cbct图像进行上颌窦的标注和分割,得到标注图像,根据标注图像和部分目标样本未标注的颅骨cbct图像建立自动分割模型;
51、图像分割和测量模块,用于根据自动分割模型对所有未标注的颅骨cbct图像进行上颌窦的自动分割,得到上颌窦分割图像,并通过测量得到所有上颌窦分割图像的各线性数据和体积;
52、数据检验模块,用于将选取的目标样本按预设的年龄区间进行分组,通过测量得到的各项数据与真实性别进行差异性检验,分别得到各年龄区间的性别差异性参数,以及通过测量得到的各项数据与真实年龄进行相关性检验,分别得到各年龄区间的年龄相关性参数;
53、推断模型建立模块,用于根据各年龄区间的性别差异性参数建立性别推断模型,并根据各年龄区间的年龄相关性参数建立年龄推断模型;
54、性别年龄推断模块,用于将待检测颅骨cbct图像输入自动分割模型得到待检测颅骨cbct图像的上颌窦各线性数据和体积,将上颌窦各项测量数据分别输入性别推断模型和年龄推断模型进行推断,并分别输出待检测颅骨cbct图像对应的性别和年龄。
55、与现有技术相比,本发明实施例提供的基于上颌窦推断性别年龄方法的有益效果在于:
56、通过收集目标样本的颅骨cbct图像,并建立自动分割模型,实现对目标样本的颅骨cbct图像进行上颌窦自动分割的训练和数据采集,再通过数据分析与模型拟合,通过测量得到的各项数据与真实性别进行差异性检验,分别得到各年龄区间的性别差异性参数,以及通过测量得到的各项数据与真实年龄进行相关性检验,分别得到各年龄区间的年龄相关性参数,根据各年龄区间的性别差异性参数建立性别推断模型,并根据各年龄区间的年龄相关性参数建立年龄推断模型。从而后续仅需输入颅骨cbct图像,即可通过各个模型的协同作用,自动分割并测量上颌窦的相关数据,并以此为基础得出性别与年龄推断结果。
1.一种基于上颌窦推断性别年龄方法,其特征在于,所述基于上颌窦推断性别年龄方法包括:
2.根据权利要求1所述的基于上颌窦推断性别年龄方法,其特征在于,所述选取部分目标样本的颅骨cbct图像进行上颌窦的标注和分割的方法包括:
3.根据权利要求1所述的基于上颌窦推断性别年龄方法,其特征在于,所述根据标注图像和部分目标样本未标注的颅骨cbct图像建立自动分割模型的方法包括:
4.根据权利要求3所述的一种基于上颌窦推断性别年龄方法的方法,其特征在于,还包括student训练模型和teacher辅助模型之间相互训练的方法:
5.根据权利要求1所述的一种基于上颌窦推断性别年龄方法的方法,其特征在于,还包括在建立自动分割模型之前,对标注图像和未标注的颅骨cbct图像进行数据处理的方法:
6.根据权利要求1所述的一种基于上颌窦推断性别年龄方法的方法,其特征在于,所述通过测量得到所有上颌窦分割图像的各线性数据和体积的方法包括:
7.根据权利要求1所述的一种基于上颌窦推断性别年龄方法的方法,其特征在于,还包括获取各年龄区间的性别差异性参数和年龄相关性参数的方法:
8.根据权利要求1所述的一种基于上颌窦推断性别年龄方法的方法,其特征在于,还包括性别推断模型和年龄推断模型的建立方法:
9.一种模型建立方法,其特征在于,所述模型建立方法包括:
10.一种推断系统,其特征在于,所述推断系统包括: