本发明总体涉及癌症的诊断、预后和治疗。具体而言,本发明涉及检测癌症患者中dna同源重组途径缺陷的方法。
背景技术:
1、同源重组是真核细胞中一种高度精确的dna修复机制。当参与同源重组途径的基因如brca1、brca2失活时,就会发生同源重组途径中的缺陷,即同源重组缺陷(hrd)。hrd会导致dna双链断裂修复的紊乱,进而导致肿瘤发生(参见lord,c.j.,&ashworth,a.(2012)the dna damage response and cancer therapy.nature,481(7381),287-294;venkitaraman,a.r.(2014)cancer suppression by the chromosome custodians,brca1and brca2.science,343(6178),1470-1475)。在乳腺和卵巢癌症患者中经常会观察到hrd,并证实其与患者对聚(adp-核糖)聚合酶(parp)抑制剂如维利帕尼(veliparib)的反应有关(nik-zainal,s.et al.(2016)landscape of somatic mutations in 560breast cancerwhole-genome sequences.nature,534(7605),47-54;coleman,r.l.et al.(2019)veliparib with first-line chemotherapy and as maintenance therapy in ovariancancer.new england journal of medicine,381(25),2403-2415)。因此,hrd的鉴定是选择更有可能从parp抑制剂治疗中获益的患者的良好标志物。
2、目前,市场上有两种fda批准的hrd伴随诊断测试,myriad genetics公司的mychoice cdx和foundation medicine公司的foundationone cdx,以及涵盖brca1和brca2的几种其他基因组合(panel)测试。mychoice cdx和foundationone cdx都使用深度测序方法识别brca1和brca2的突变状态或高基因组不稳定性评分,如作为阳性hrd标志物的杂合性缺失(loh)。这些方法通常需要高测序深度(foundationone cdx具有500的中位覆盖率)、ffpe样品和匹配的正常组织样品中高肿瘤比例(foundationone cdx推荐高于25%)才能具有良好的灵敏度。对于检测癌症患者的hdr,仍然需要开发新的方法。
技术实现思路
1、本公开在一个方面中提供了一种用于检测癌症患者的dna同源重组途径缺陷的方法。在一些实施方式中,该方法包括:从患者获得肿瘤样品的wgs数据(全基因组测序数据);从wgs数据生成基因组拷贝数谱;从基因组拷贝数谱中使用深度学习模型为每个染色体生成染色体不稳定性(ci)评分,从而生成ci评分组;从ci评分组生成dna同源重组途径缺陷的风险评分;确定风险评分大于阈值数;并确定患者存在dna同源重组途径缺陷的风险。在一些实施方式中,该方法不需要来自患者的正常组织/样品的wgs数据。
2、在一些实施方式中,该风险评分的阈值数为0.4。在一些实施方式中,当风险评分大于0.6时,dna同源重组途径缺陷的风险很高。在一些实施方式中,当风险评分大于0.4且小于或等于0.6时,dna同源重组途径缺陷的风险中等。
3、在一些实施方式中,该深度学习模型包括长短期记忆层和全连接网络。
4、在一些实施方式中,该风险评分是按每条染色体的碱基长度、每条染色体的位置或每条cna断裂的位置进行加权的ci评分组的平均值。
5、在一些实施方式中,检测癌症患者dna同源重组途径缺陷的方法包括:从患者获得肿瘤样品的全基因组测序(wgs)数据,其中wgs数据具有0.05-1的测序深度;从wgs数据生成基因组变异谱,基因组变异谱中含有拷贝数改变、基因融合、倒位谱或易位;根据基因组变异谱,为每个基因组生成多个大规模基因组断点(lgb),其中lgb是具有不同基因组拷贝数的两个相邻基因组片段之间的断点,每个这样的基因组片段具有至少特定阈值的长度(例如,10兆碱基);确定lgb数大于lgb阈值数;并将患者鉴定为具有dna同源重组途径缺陷的风险。
6、在一些实施方式中,lgb的阈值数为25。在一些实施方式中,当lgb的数量大于35时,患者具有dna同源重组途径缺陷的风险高。在一些实施方式中,当lgb的数量大于25且小于或等于35时,患者具有dna同源重组途径缺陷的风险中等。
7、在一些实施方式中,肿瘤样品是ffpe样品或ctc样品。
8、在一些实施方式中,癌症选自乳腺癌、卵巢癌、胰腺癌、头颈癌和黑色素瘤。在一些实施方式中,癌症是乳腺癌。
9、在一些实施方式中,基因组拷贝数谱包括选自如下任意一种参数或其组合:沿基因组的基因组片段、基因组片段的拷贝数、拷贝数变异(cna)断裂点或cna断裂点的数量。在一些实施方式中,基因组拷贝数谱还包括所涉及的融合、倒转和易位事件的数量。
10、在一些实施方式中,基因组拷贝数谱通过以下步骤生成:将wgs数据与参考基因组比对,从而沿基因组生成一组经比对的wgs读段,对基因组上比对过的wgs读段进行计数,并沿基因组生成基因组片段,其中两个相邻基因组片段具有显著不同的读段计数。融合或易位事件是通过识别被映射到染色体内或跨染色体的不同位置的产生了分割点的读段(split reads)或读段对来确定的;倒转是通过在同一染色体上具有错误方向的读段对来确定的。
11、在一些实施方式中,本文公开的方法还包括向患者给药治疗有效量的parp抑制剂和/或烷化剂。在一些实施方式中,parp抑制剂和/或烷基化剂选自依尼帕利(iniparib)、奥拉帕利(olaparib)、鲁卡帕尼(rucaparib)、cep9722、mk4827、bmn673、3-氨基苯甲酰胺、铂络合物、双(2-氯乙基)甲胺(chlormethine)、苯丁酸氮芥(chlorambucil)、美法仑(melphalan)、环磷酰胺(cyclophosphamide)、异环磷酰胺(ifosfamide)、雌莫司汀(estramustine)、卡莫司汀(carmustine)、洛莫司汀(lomustine)、福莫司汀(fotemustine)、链脲佐菌素(streptozocin)、白消安(busulfan)、哌泊溴烷(pipobroman)、丙卡巴肼(procarbazine)、达卡巴嗪(dacarbazine)、噻替帕(thiotepa)和替莫唑胺(temozolomide)。
12、在另一方面中,本公开提供了一种用于治疗患者癌症的方法。在一些实施方式中,该方法包括向患者给药治疗有效量的parp抑制剂和/或烷化剂,其中患者已经通过本文公开的方法鉴定为具有dna同源重组途径缺陷的风险。
1.一种检测癌症患者dna同源重组途径缺陷的方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,(i)所述阈值数是0.4;或(ii)当所述风险评分大于0.6时,所述dna同源重组途径缺陷的风险高;或(iii)当所述风险评分大于0.4且小于或等于0.6时,所述dna同源重组途径缺陷的风险是中等的。
3.根据权利要求1所述的方法,其特征在于,所述肿瘤样品为ffpe样品或ctc样品。
4.根据权利要求1的方法,其特征在于,所述癌症选自乳腺癌、卵巢癌、胰腺癌、头颈癌和黑色素瘤。
5.根据权利要求1所述的方法,其特征在于,所述基因组拷贝数谱选自如下任意一种参数或其组合:沿基因组的基因组片段、所述基因组片段的拷贝数、拷贝数变异(cna)断裂点或所述cna断裂点的数量。
6.根据权利要求1所述的方法,其特征在于,所述基因组拷贝数谱通过以下步骤生成:
7.根据权利要求1所述的方法,其特征在于,所述深度学习模型包括一个或多个长短期记忆层或卷积神经网络层,以及全连接网络。
8.根据权利要求1所述的方法,其特征在于,所述风险评分是按每个染色体的碱基长度加权的所述ci评分组的平均值。
9.一种用于治疗患者癌症的方法,其特征在于,所述方法包括
10.根据权利要求9所述的方法,其特征在于,所述parp抑制剂和/或烷基化剂选自依尼帕利(iniparib)、奧拉帕尼(olaparib)、鲁卡帕尼(rucaparib)、cep9722、mk4827、bmn673、3-氨基苯甲酰胺、铂络合物、双(2-氯乙基)甲胺(chlormethine)、苯丁酸氮芥(chlorambucil)、美法仑(melphalan)、环磷酰胺(cyclophosphamide)、异环磷酰胺(ifosfamide)、雌莫司汀(estramustine)、卡莫司汀(carmustine)、洛莫司汀(lomustine)、福莫司汀(fotemustine)、链脲佐菌素(streptozocin)、白消安(busulfan)、哌泊溴烷(pipobroman)、丙卡巴肼(procarbazine)、达卡巴嗪(dacarbazine)、噻替帕(thiotepa)和替莫唑胺(temozolomide)。
11.一种其上存储有指令的非暂时性计算机可读介质,其特征在于,所述指令在由处理器执行时使所述处理器执行包括以下步骤的方法:
12.根据权利要求11所述的非暂时性计算机可读介质,其特征在于,所述方法还包括:
13.一种用于检测癌症患者中的dna同源重组途径缺陷的方法,其特征在于,所述方法包括:
14.根据权利要求13所述的方法,其特征在于,(i)所述lgb阈值数为25;或(ii)当所述lgb的数量大于35时,所述dna同源重组途径缺陷的风险高;或(iii)当所述lgb的数量大于25且小于或等于35时,所述dna同源重组途径缺陷的风险中等。
15.根据权利要求13所述的方法,其特征在于,所述肿瘤样品是ffpe样品或ctc样品。
16.根据权利要求13所述的方法,其特征在于,所述癌症选自乳腺癌、卵巢癌、胰腺癌、头颈癌和黑色素瘤。
17.根据权利要求13所述的方法,其特征在于,所述基因组拷贝数谱通过以下步骤生成:
18.一种用于治疗患者的癌症的方法,所述方法包括
19.根据权利要求18所述的方法,其中所述parp抑制剂和/或烷基化剂选自依尼帕利(iniparib)、奧拉帕尼(olaparib)、鲁卡帕尼(rucaparib)、cep9722、mk4827、bmn673、3-氨基苯甲酰胺、铂络合物、双(2-氯乙基)甲胺(chlormethine)、苯丁酸氮芥(chlorambucil)、美法仑(melphalan)、环磷酰胺(cyclophosphamide)、异环磷酰胺(ifosfamide)、雌莫司汀(estramustine)、卡莫司汀(carmustine)、洛莫司汀(lomustine)、福莫司汀(fotemustine)、链脲佐菌素(streptozocin)、白消安(busulfan)、哌泊溴烷(pipobroman)、丙卡巴肼(procarbazine)、达卡巴嗪(dacarbazine)、噻替帕(thiotepa)和替莫唑胺(temozolomide)。
20.一种其上存储有指令的非暂时性计算机可读介质,其特征在于,所述指令在由处理器执行时使所述处理器执行权利要求13所述的方法。
21.一种适用于患者癌症治疗方法的parp抑制剂和/或烷基化剂,其特征在于,所述患者已通过权利要求1或12所述的方法鉴定为具有所述dna同源重组途径缺陷的风险。
22.用于权利要求21的所述parp抑制剂和/或烷基化剂,其特征在于,所述parp抑制剂或烷基化试剂选自依尼帕利、奧拉帕尼、鲁卡帕尼、cep9722、mk4827、bmn673、3-氨基苯甲酰胺、铂络合物、双(2-氯乙基)甲胺、苯丁酸氮芥、美法仑、环磷酰胺、异环磷酰胺、雌莫司汀、卡莫司汀、洛莫司汀、福莫司汀、链脲佐菌素、白消安、哌泊溴烷、丙卡巴肼、达卡巴嗪、噻替帕和替莫唑胺。