一种识别生物分子网络中收敛模块节点的方法

专利2025-04-19  17


本发明属于生物信息。具体地,本发明涉及疾病和药物干预的复杂分子网络如蛋白质相互作用网络、基因表达调控网络、药物代谢和药物靶点网络等中收敛模块节点的识别方法。


背景技术:

1、随着组学时代的兴起和高通量技术的不断进步,大量的生物数据集被产生出来。以生物条目(如蛋白质、基因、代谢物等)为节点,以节点对之间的关系为边,从而形成了多种虚拟的生物分子网络,比如蛋白质相互作用网络、基因表达调控网络和药物代谢网络等。通过对这些数据网络进行有效的分析,有助于揭示基因表达调控、蛋白质相互作用、代谢物相互作用等机制,进而能够在疾病机制研究与治疗、药物开发等领域得到应用。

2、研究表明,在生物分子网络中存在着模块化的组织结构。识别这种模块结构及模块中的关键节点有助于简化和降低复杂网络的维度,理解生物系统,系统性地揭示药物作用的复杂机制,以及研发新药,尤其是研发针对复杂疾病的新药。发明人在公开号cn105956413a(公开日2016年9月21日)的中国发明专利申请中已经公开了一种识别生物分子网络中关键节点的方法。该方法涉及先识别生物分子网络的关键模块,然后再识别该模块中的关键节点。

3、随着对生物分子网络研究的深入,研究人员认识到生物分子网络中存在着一个收敛的概念,其意味着模块节点存在一个上限。当模块节点超过这个上限时,即使继续增加节点数量,其影响也将达到饱和。

4、在复杂事物中抓住主要矛盾是解决问题的关键所在。目前已有研究者基于k核算法和ci(collective influence,“集体影响力”)算法开展了收敛模块或收敛节点的识别工作,但是这些算法往往忽视了模块节点的联合传播因素,未能考虑网络的局部、半局部和全局拓扑维度模块间关系对收敛模块的影响,缺乏对收敛模块节点的定量分析。


技术实现思路

1、针对上述技术问题,本发明提供一种能够识别生物分子网络中收敛模块节点的新方法,该方法能够捕获网络的所有拓扑维度,同时解决全局中心性度量的位置偏差,从而在生物分子网络中识别出收敛模块节点。

2、定义:

3、在本文中,所述的“生物分子网络”即是指以不同组织形式存在于生物系统中的网络,其由代表各类生物分子的节点和代表生物分子之间相互作用关系的边所构成。常见的生物分子网络包括基因转录调控网络、生物代谢网络、表观遗传网络、表型网络、信号传导网络、蛋白质相互作用网络等。

4、在本文中,术语“收敛模块节点”是指网络中在结构和功能上均占据临界性的模块节点,如其对网络的信息传递、节点的相互作用等方面具有重要影响,删除此节点对网络结构和信息传递的影响超过删除网络中其他节点对网络结构和信息传递影响。

5、在本文中,术语“k核算法”是一种启发式网络收敛节点集合的算法,其核心思想是依据节点在网络中的核心度进行度量,其中位于网络核心区域的节点相较于边缘节点具有更高的影响力。具体实现过程如下:首先,将网络中的孤立节点视为核心度为0的节点,并从网络中移除。随后,进行核分解操作。此过程中,先从网络中剔除所有核心度为1的节点,然后持续移除剩余度小于或等于1的节点,直至网络中所剩节点的剩余度均大于1。被移除的这些节点统称为1核节点,其核度值为1。接下来,采用同样的方式处理网络中核心度为2的节点。这一流程持续进行,直至网络中的所有节点均被移除。在此方法下,核心度较高的节点通常位于网络的中心位置,具有较大的影响力。

6、在本文中,术语“ci”是指集体影响力(collective influence),分子生物网络中每个节点的ci值可以通过公式(1)计算。

7、cii=(di-1)∑j∈δb(i,l)(dj-1)  (1),

8、其中,di,dj分别表示节点i,j的度;δb(i,l)是由节点i的最短路径的长度为l的节点组成的球边界,一般设置l=1。

9、术语“ci算法”是一种基于集体影响力ci值的网络收敛节点集合的算法。该算法的主要思想是移除每次迭代中ci值最大的节点,以快速崩溃网络,直至由公式(2)计算的λ≤1。

10、

11、其中,n是节点总数,是网络的平均度,cii是节点i的集体影响力值,一般设置l=1。当λ≤1时,移除过程将停止,这意味着大多数巨型组件消失。

12、在本文中,术语“ivi值”是指综合影响值(integrated value if influence),其体现了度中心性(dc,degree centrality)、聚类等级(cr,clusterrank)、领域连通性(nc,neighborhood connectivity)、局部h指数(h)、介数中心度(bc,betweenness centrality)和集体影响力(ci)。分子生物网络中每个节点的ivi值可以通过公式(3)计算。

13、

14、其中,dci、nci、cri、bci和cii分别是节点i的范围归一化度中心性、范围归一化局部h指数、范围归一化域连通性、范围归一化集群秩、范围归一化介数中心度和范围归一化集体影响力,其中cii由公式(1)计算得到。

15、本发明采用了如下的技术方案:

16、一种识别生物分子网络中收敛节点的方法,包括如下步骤:

17、(1)确定需要识别收敛节点的生物分子网络;

18、(2)根据公式(1)计算所述生物分子网络中每个节点的集体影响力ci值,

19、cii=(di-1)zi∈δb(i,l)(dj-1)  (1),

20、其中,di,dj分别表示节点i,j的度;δb(i,l)是由节点i的最短路径的长度为l的节点组成的球边界,l=1;

21、然后代入公式(3)计算每个节点的整体综合影响指标ivi值,

22、

23、其中,dci、nci、cri、bci和cii分别是节点i的范围归一化度中心性、范围归一化局部h指数、范围归一化域连通性、范围归一化集群秩、范围归一化介数中心度和范围归一化集体影响力;

24、再将ivi值代入公式(4)计算每个节点的ci-ivi值;

25、ci-ivii=(ivii-1)σj∈δb(i,l)(ivij-1)  (4),

26、其中,ivii和ivij分别是节点i和节点j的整体综合影响指标值,δb(i,l)是由节点i的最短路径的长度为l的节点组成的球边界,l=1;

27、根据计算结果排序,移除ci-ivi值最大的节点;然后根据公式(5)计算λ,

28、

29、其中,n是节点总数,是网络的平均度,ci-ivii由公式(4)计算得到;

30、(4)如果λ≤1,则结束识别,移除的节点就是收敛节点;如果λ>1,则进行步骤(5);

31、(5)按照公式(1)、(3)和(4)重新计算得到所述生物分子网络剩余每个节点的ci-ivi值,排序,移除ci-ivi值最大的节点,按照公式(5)计算λ;

32、(6)如果λ≤1,则结束识别,移除的所有的节点就是收敛节点集合;如果λ>1,则重复步骤(5),直到λ≤1。

33、优选地,所述生物分子网络选自基因表达调控网络、蛋白质相互作用网络、生物代谢网络、表观遗传网络、表型网络、信号传导网络等;更优选为基因表达调控网络。

34、所述生物分子网络可以是任意本领域已知的,如专利或非专利文献报道的。也可以是根据特定目的构建的。例如,所述生物分子网络可以是实施例中构建的“肺腺癌转移预后差异基因调控网络”。

35、通常地,所述生物分子网络包含≥3个节点和≥3条边。例如,本文实施例构建的“肺腺癌转移预后差异基因调控网络”包含90个节点和157条边。

36、本发明所述的识别生物分子网络中收敛节点的方法,创新性地将集体影响力ci值和整体综合影响指标ivi值整合起来,基本流程图见图1所示,其基本的思想可以概括为:

37、(1)对节点整体综合影响指标ivi进行计算,基于节点的整体综合影响指标ivi进一步计算节点的ci-ivi值。

38、(2)删除在每次迭代中具有最大的ci-ivi值的节点以快速瓦解网络。即具有最大ci-ivi值的节点将被移除,然后计算网络中剩余的每个节点的新ci-ivi值;并更新λ值,当λ≤1时表明移除过程中的大多数巨型组件消失。最终得到收敛节点排序的列表。

39、复杂网络均由节点和节点之间的关系(边)组成。在网络中,模块节点地位存在差异。事实上,收敛模块节点对网络具有不同的功能,当移除收敛模块节点时,网络会发生临界性崩溃,因此收敛模块节点的识别对于了解整个网络的作用机制是非常重要的。因此收敛模块节点的研究为探索复杂疾病药物联合应用产生协同效应的主要药理机制奠定基石;为进一步分析药物间相互关系、指导联合用药和疾病治疗打下基础,为指导疾病治疗和药物研发提供科学依据。

40、对此,本发明对于疾病和药物干预的复杂网络,提出要识别收敛模块节点这一创新概念,并且针对该概念,具体提供了整合ci和ivi的从生物分子网络中识别收敛模块节点的新方法。在该具体识别过程中,能够捕获网络的所有拓扑维度,解决中心性度量的位置偏差,根据复杂网络渗流思想定量识别出收敛模块节点。本发明的方法综合考虑了多个重要网络中心性度量结果,包括度中心性、聚类登记、邻域连通性、局部h指数、介数中心性和集体影响力等。每个中心性度量都捕获了网络的不同拓扑维,包括局部、半局部和全局拓扑维度。


技术特征:

1.一种识别生物分子网络中收敛节点的方法,包括如下步骤:

2.根据权利要求1所述的方法,其特征在于,所述生物分子网络选自基因表达调控网络、蛋白质相互作用网络、生物代谢网络、表观遗传网络、表型网络、信号传导网络等;更优选为基因表达调控网络。

3.根据权利要求2所述的方法,其特征在于,所述生物分子网络包含≥3个节点和≥3条边。

4.根据权利要求2所述的方法,其特征在于,所述生物分子网络是肺腺癌转移预后差异基因调控网络。

5.根据权利要求4所述的方法,其特征在于,所述肺腺癌转移预后差异基因调控网络包含90个节点和157条边。


技术总结
本发明公开了一种识别生物分子网络中收敛节点的方法,包括如下步骤:(1)确定需要识别收敛节点的生物分子网络;(2)计算所述生物分子网络中每个节点的集体影响力CI值、整体综合影响指标IVI值和CI‑IVI值;根据计算结果排序,移除CI‑IVI值最大的节点;然后计算λ;(4)如果λ≤1,则结束识别,移除的节点就是收敛节点;如果λ>1,则进行步骤(5);(5)重新计算得到所述生物分子网络剩余每个节点的CI‑IVI值,排序,移除CI‑IVI值最大的节点,计算λ;(6)如果λ≤1,则结束识别,移除的所有的节点就是收敛节点集合;如果λ>1,则重复步骤(5),直到λ≤1。相比较已知的识别生物分子网络中收敛节点的方法,本发明的方法有效性更高。

技术研发人员:王忠,刘溪,刘骏
受保护的技术使用者:中国中医科学院中医临床基础医学研究所
技术研发日:
技术公布日:2024/12/17
转载请注明原文地址:https://xbbs.6miu.com/read-23619.html