本发明涉及图像处理,尤其涉及一种高度可控的染色体图像生成方法及系统。
背景技术:
::1、染色体核型分析是一种重要的遗传学检测技术,用于观察和分析细胞中染色体的数量和结构,广泛应用于遗传学研究、产前诊断、不孕不育诊断和肿瘤学研究中。该分析尤其在诊断染色体异常相关的疾病时至关重要,如唐氏综合征、特纳综合征和克氏综合征等。2、对于异常染色体的检测和分析,通常会在使用显微镜拍摄其高倍镜图像后,使用染色体核型分析系统进行分析。在实际分析过程中,部分异常类型会出现频率低,数据量少,且异常形态较难分辨的情况。通常该情况下会缺少可用于对比的异常模板,因此对于这类异常染色体,人工合成对应异常类型的染色体作为模版,供分析人员进行对比分析是一种有效的解决方案。3、目前已有的染色体生成方法有通过染色体图片进行拼接生成,该方法其优点为简单直接,且使用真实数据进行生成,数据可靠性高,缺点为需使用真实染色体图像,不能实现从无到有,且无法控制染色体形态。技术实现思路1、本发明提供一种高度可控的染色体图像生成方法及系统,可以在多种场景下实现从无到有的,高度可控的染色体图像生成,解决部分异常染色体图像数量稀少的问题。2、第一方面,本发明提供一种高度可控的染色体图像生成方法,所述方法包括:3、步骤1,染色体生成模块中的结构化掩码构成器获取染色体骨架线;获取染色体骨架线的方法采用染色体图像直接提取染色体骨架线或者采用线条构成器生成染色体骨架线;4、采用染色体图像直接提取染色体骨架线包括:对染色体图像进行二值化处理,得到形状掩码,根据形状掩码提取染色体骨架线;5、采用线条构成器生成染色体骨架线包括:通过画图接口获取用户手动绘制的染色体骨架线;或者,通过指定骨架线线长度l,随机生成染色体骨架线;6、步骤2,从染色体结构化数据库或者染色体结构化模块中获取染色体结构化数据,所述染色体结构化数据包括带纹顺序列表与着丝粒位置;7、步骤3,在骨架线上按照带纹顺序列表中的位置绘制带纹位置;8、步骤4,按照着丝粒位置绘制染色体着丝粒,得到染色体结构化掩码图。9、进一步地,步骤1中,通过指定骨架线线长度l,随机生成染色体骨架线,包括:10、步骤2.1,指定骨架线线长度l,设定线段采样点个数n,计算每个采样点之间的平均距离dmean=l/n;11、步骤2.2,随机生成起始点p0,并随机生成向量角度a,以平均距离dmean为向量模,计算下一个点p1的位置;12、步骤2.3,在-10度至10度的范围内随机生成角度偏移量a1,以点p1作为起点,以角度a+a1作为向量角度,以平均距离dmean作为向量长度,计算下一个点p2;13、步骤2.4,重复步骤2.3,直至完成n个点的采样,得到长度为l的一条骨架线。14、进一步地,步骤2中,染色体结构化模块工作步骤包括:15、步骤3.1,从染色体图像数据库选取染色体掩码图像,将染色体掩码图像拆分为3张单通道图像,其中通道r为染色体带纹掩码,通道g为染色体骨架线掩码,通道b为染色体着丝粒掩码;16、步骤3.2,使用opencv中的提取染色体轮廓方法提取染色体带纹掩码轮廓,根据所提取的所有轮廓,依次求出轮廓中心,得到染色体所有带纹的带纹中心列表;17、步骤3.3,判断所述点的像素灰度是否为0,像素灰度为0,则认为该像素属于背景,像素灰度不为0,则认为该像素为骨架线上的像素;提取骨架线所有点的坐标,记录骨架线上、下端点,得到骨架线端点坐标和骨架线上所有点的坐标;18、步骤3.4,选取步骤3.3中的上端点作为起始坐标,遍历上端点周围的骨架线点坐标,记录该坐标的坐标位置和遍历顺序,并以该坐标作为新的起始坐标,以此往复,直至遍历到下端点,得到骨架线上所有点的位置顺序列表;19、步骤3.5,计算骨架线长度,计算方法为计数步骤3.4中提取的位置顺序列表点的数量;20、步骤3.6,遍历步骤3.2中所有带纹的带纹中心列表,并计算与步骤3.4中所提取的位置顺序列表中所有点的欧式距离,选取与该带纹中心点距离最近的骨架线点的顺序作为该带纹的顺序编号,记录其顺序编号,得到带纹顺序列表;21、步骤3.7,使用步骤3.3相同方法,提取染色体着丝粒掩码中的着丝粒位置,并使用步骤3.5中的方法计算着丝粒在骨架线上的顺序编号,记录着丝粒位置编号;22、步骤3.8,结构化保存带纹顺序列表和着丝粒位置编号做为一条记录,入库染色体结构化数据库。23、进一步地,步骤2中,所述染色体图像数据库的构建方法如下:24、步骤4.1,选取具有类别信息的单体染色体图片作为基础数据;25、步骤4.2,对选取的基础数据进行人工标注;标记染色体上下端点,带纹位置,染色体骨架线和着丝粒位置,作为染色体掩码图,并与对应的染色体图像为一组,存入染色体图像数据库;标注使用不同通道进行不同信息的标注,通道r记录带纹位置,通道g记录骨架线位置,其中上端点像素值标记为64,下端点标记为196,骨架线标注为128,通道b记录着丝粒位置。26、进一步地,所述方法还包括:训练染色体生成模块中的扩散生成模型:27、步骤5.1,从染色体图像数据库中读取记录,记录中具体内容包括:染色体图像和染色体掩码图像;28、步骤5.2,构建扩散生成模型网络,使用stable diffusion+controlnet作为基础网络,进行扩散生成任务;29、步骤5.3,将染色体掩码图像作为controlnet的控制输入,染色体图像作为stablediffision的生成目标,训练染色体图像扩散生成模型;30、步骤5.4,按照上述流程训练染色体图像数据库中的所有记录,并进行多轮训练,得到染色体图像扩散生成模型chrsd;31、步骤5.5,使用染色体图像作为controlnet的控制输入,染色体掩码图像作为stable diffsion的生成目标,训练染色体掩码图像扩散生成模型,得到染色体掩码图像扩散模型chr2masksd;32、步骤5.6,使用染色体结构化掩码图作为controlnet的控制输入,染色体掩码图像作为stable diffsion的生成目标,训练染色体掩码图像扩散生成模型,得到染色体掩码图像扩散模型struct2masksd。33、进一步地,所述方法还包括:34、步骤6.1,将染色体输入染色体掩码图像扩散模型chr2masksd,生成染色体掩码图像,该图像包含了染色体带纹,着丝粒和骨架线信息;35、步骤6.2,使用染色体结构化模块提取步骤6.1中染色体掩码图的带纹顺序列表和着丝粒位置;36、步骤6.3,根据步骤6.2中的带纹顺序列表和着丝粒位置,按照实际异常逻辑结构如交换带纹位置等重新构造异常结构化数据;37、步骤6.4,使用结构化掩码构成器构建异常染色体结构化掩码图;38、步骤6.5,将异常染色体结构化掩码图输入染色体掩码图像扩散模型struct2masksd,生成异常染色体掩码图;39、步骤6.6,将异常染色体掩码图输入染色体扩散生成模型chrsd,生成异常染色体。40、进一步地,所述方法还包括:41、步骤7.1,通过线条生成器生成染色体骨架线;42、步骤7.2,从染色体结构化数据库中获取一条染色体结构化数据;43、步骤7.3,根据异常逻辑重新构造结构化数据,异常逻辑包括交换带纹位置,构造异常染色体结构化数据;44、步骤7.4,使用结构化掩码构成器将步骤7.3中的异常染色体结构化数据构造为异常染色体结构化掩码图;45、步骤7.5,将异常染色体结构化掩码图输入染色体掩码图像扩散模型struct2masksd,生成异常染色体掩码图;46、步骤7.6,将异常染色体掩码图输入染色体扩散生成模型chrsd,生成异常染色体;47、重复步骤7.1~步骤7.6,批量生成异常染色体。48、第二方面,本发明提供一种高度可控的染色体图像生成系统,用于实现以上所述的高度可控的染色体图像生成方法,包括:49、染色体图像数据库,用于提供染色体图像和其对应的染色体掩码图;50、染色体生成模块,用于通过染色体生成模块中的结构化掩码构成器获取染色体骨架线;获取染色体骨架线的方法采用染色体图像直接提取染色体骨架线或者采用线条构成器生成染色体骨架线;采用染色体图像直接提取染色体骨架线包括:对染色体图像进行二值化处理,得到形状掩码,根据形状掩码提取染色体骨架线;采用线条构成器生成染色体骨架线包括:通过画图接口获取用户手动绘制的染色体骨架线;或者,通过指定骨架线线长度l,随机生成染色体骨架线;从染色体结构化数据库或者染色体结构化模块中获取染色体结构化数据,所述染色体结构化数据包括带纹顺序列表与着丝粒位置;在骨架线上按照带纹顺序列表中的位置绘制带纹位置;按照着丝粒位置绘制染色体着丝粒,得到染色体结构化掩码图;51、染色体图像结构化模块,用于将与染色体图像所对应的染色体掩码图像进行结构化,并进行提供异常化处理和结构化数据出入库功能;52、染色体结构数据库,用于保存结构化后的染色体掩码图像信息。53、本发明具有以下有益效果:本发明的一种高度可控的染色体图像生成方法及系统,可以实现指定形态和弯曲程度的染色体生成,还可以在多种场景下进行染色体生成。通过实验表明,该方法可以有效生成染色体图像,且生成可控性高。核心创新点在于将染色体的形态和带纹进行了结构化处理,在此基础上,使用了多层级生成方法,将染色体图像生成和染色体结构构造分离,使得生成的染色体图像高度可控且带纹结构完整。当前第1页12当前第1页12
技术特征:1.一种高度可控的染色体图像生成方法,其特征在于,所述方法包括:
2.如权利要求1所述的一种高度可控的染色体图像生成方法,其特征在于,步骤1中,通过指定骨架线线长度l,随机生成染色体骨架线,包括:
3.如权利要求2所述的一种高度可控的染色体图像生成方法,其特征在于,步骤2中,染色体结构化模块工作步骤包括:
4.如权利要求3所述的一种高度可控的染色体图像生成方法,其特征在于,步骤2中,所述染色体图像数据库的构建方法如下:
5.如权利要求4所述的一种高度可控的染色体图像生成方法,其特征在于,所述方法还包括:训练染色体生成模块中的扩散生成模型:
6.如权利要求5所述的一种高度可控的染色体图像生成方法,其特征在于,所述方法还包括:
7.如权利要求6所述的一种高度可控的染色体图像生成方法,其特征在于,所述方法还包括:
8.一种高度可控的染色体图像生成系统,用于实现权利要求1~7任一项所述的高度可控的染色体图像生成方法,其特征在于,包括:
技术总结本发明公开一种高度可控的染色体图像生成方法及系统,该方法包括染色体生成模块中的结构化掩码构成器获取染色体骨架线;从染色体结构化数据库或者染色体结构化模块中获取染色体结构化数据,所述染色体结构化数据包括带纹顺序列表与着丝粒位置;在骨架线上按照带纹顺序列表中的位置绘制带纹位置;按照着丝粒位置绘制染色体着丝粒,得到染色体结构化掩码图;该高度可控的染色体图像生成系统包括:染色体图像数据库,染色体生成模块,染色体图像结构化模块,染色体结构数据库;该方法可以有效生成染色体图像,且生成可控性高。
技术研发人员:邓福韬,卢沁阳,穆阳,刘丽珏,蔡昱峰,彭伟雄
受保护的技术使用者:湖南自兴智慧医疗科技有限公司
技术研发日:技术公布日:2024/12/17