本文涉及计算机与医学交叉领域,尤指一种链路预测方法、装置及存储介质。
背景技术:
1、图数据挖掘中的链路预测用于预测图中两个节点之间是否存在链接。已知的链路预测方法大致包括根据相似度的方法、根据最大似然的方法、根据机器学习的方法和根据图神经网络的方法。其中,根据图神经网络的方法是将已知节点与链接构建成普通图,然后通过图神经网络学习得到图中节点的表示向量,将根据学习得到的节点的表示向量进行链路预测。或者根据k近邻等距离函数将已知信息构建成超图,然后通过超图神经网络学习得到节点的表示向量以用于链路预测。
技术实现思路
1、以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。
2、本申请实施例提供了一种链路预测方法、装置及存储介质,该链路预测方法不仅能反应节点特征信息的高阶关系,而且能够体现网络结构信息的高阶关系,有助于提高链路预测的准确性。
3、本申请实施例提供的一种链路预测方法,包括:
4、获取预设第一数据集,根据所述预设第一数据集确定n个节点以及节点之间的已知连边信息,n为大于或等于3的正整数;
5、确定所述n个节点的初始特征向量;
6、分别根据所述n个节点的初始特征向量和所述节点之间的已知连边信息生成节点之间的超边;
7、根据所述n个节点和生成的超边构建超图并对所述超图进行超图表示学习;
8、根据所述超图表示学习结果进行节点之间的链路预测。
9、在一种示例性的实施例中,根据所述节点之间的已知连边信息生成节点之间的超边,包括:
10、根据所述节点之间的已知连边信息构建普通图;
11、确定所述普通图的邻接矩阵;
12、根据所述邻接矩阵建立每个节点的线性回归模型;
13、求解所述每个节点的线性回归模型的优化目标;
14、根据求解结果生成超边。
15、在一种示例性的实施例中,所述线性回归模型为:
16、b(i)=x(i)z(i)+b(i);
17、其中,b表示所述邻接矩阵,b(i)为所述邻接矩阵的第i行,表示节点i的结构信息,x(i)表示除了节点i以外的其他节点的结构信息,z(i)为回归系数,表示节点i与其他节点之间的相关性系数,b(i)为随机误差项,1≤i≤n。
18、在一种示例性的实施例中,所述优化目标按照下式确定:
19、minz(i)||b(i)-x(i)z(i)||+λ||z(i)||;
20、其中,||·||表示l1范数,min表示取最小值,λ为正则化参数,0<λ<1。
21、在一种示例性的实施例中,所述根据求解结果生成超边,包括:
22、将z(i)中不为0的元素对应的节点与节点i生成一条超边。
23、在一种示例性的实施例中,所述对所述超图进行超图表示学习,包括:
24、将所述n个节点和生成的超边构建的超图作为初始超图;
25、通过多层超图卷积神经网络对所述初始超图进行超图表示学习与结构调整;
26、其中,所述多层超图卷积神经网络的每一层由一层超图卷积神经网络构成。
27、在一种示例性的实施例中,所述通过多层超图卷积神经网络对所述超图进行超图表示学习与结构调整,包括:
28、将所述初始超图输入到所述多层超图卷积神经网络的第一层,得到第一层的节点的特征向量;
29、所述多层超图卷积神经网络的第i+1层的输入为根据第i层的节点的特征向量生成的第i+1层超图;所述多层超图卷积神经网络的第i+1层的输出为第i+1层的节点的特征向量,其中,1≤i<m,m为所述多层超图卷积神经网络的总层数。
30、在一种示例性的实施例中,所述根据第i层的节点的特征向量生成第i+1层超图,包括:
31、根据第i层的节点的特征向量基于k近邻算法生成第i+1层超图。
32、在一种示例性的实施例中,所述超图表示学习结果为第m层的节点的特征向量。
33、在一种示例性的实施例中,所述根据所述超图表示学习进行节点之间的链路预测,包括:
34、根据所述超图表示学习计算待预测节点对的特征向量之间的余弦相似度,根据预设余弦相似度阈值判断所述待预测节点对之间是否存在关联;
35、或者,
36、根据所述超图表示学习计算待预测节点对的特征向量之间的内积,根据预设内积阈值判断所述待预测节点对之间是否存在关联;
37、或者,
38、根据所述超图表示学习对待预测节点对的特征向量进行拼接,将拼接后的特征向量输入到二分类器中来判断所述待预测节点对之间是否存在关联。
39、在一种示例性的实施例中,所述n个节点包括mirna节点和疾病节点;
40、所述确定所述n个节点的初始特征向量,包括:
41、确定疾病语义相似度矩阵和mirna功能相似度矩阵;
42、构建mirna-疾病邻接矩阵,根据所述mirna-疾病邻接矩阵分别确定疾病高斯谱核相似度矩阵和mirna高斯谱核相似度矩阵;
43、整合所述疾病语义相似度矩阵和疾病高斯谱核相似度矩阵得到疾病整合相似度矩阵;整合所述mirna功能相似度矩阵和mirna高斯谱核相似度矩阵得到mirna整合相似度矩阵;
44、根据所述疾病整合相似度矩阵和所述mirna整合相似度矩阵确定所述n个节点的初始特征向量。
45、本申请实施例还提供了一种链路预测装置,包括存储器和处理器,
46、所述存储器,用于保存用于链路预测的程序;
47、所述处理器,用于读取执行所述链路预测的程序,执行上述任一实施例所述的链路预测方法。
48、本申请实施例提供了一种计算机可读存储介质,存储有计算机可执行指令,其中,所述计算机可执行指令用于使所述计算机执行上述任一实施例所述的链路预测方法。
49、在阅读并理解了附图和详细描述后,可以明白其他方面。
50、本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的其他优点可通过在说明书以及附图中所描述的方案来实现和获得。
1.一种链路预测方法,其特征在于,包括:
2.如权利要求1所述的链路预测方法,其特征在于:
3.如权利要求2所述的链路预测方法,其特征在于:
4.如权利要求3所述的链路预测方法,其特征在于:
5.如权利要求4所述的链路预测方法,其特征在于:
6.如权利要求1所述的链路预测方法,其特征在于:
7.如权利要求6所述的链路预测方法,其特征在于:
8.如权利要求7所述的链路预测方法,其特征在于:
9.如权利要求7所述的链路预测方法,其特征在于:
10.如权利要求1、6至7中任一项所述的链路预测方法,其特征在于:
11.如权利要求1所述的链路预测方法,其特征在于:
12.一种链路预测装置,包括存储器和处理器,其特征在于,
13.一种计算机可读存储介质,存储有计算机可执行指令,其中,所述计算机可执行指令用于使所述计算机执行所述权利要求1至11中任一项所述的方法。