本技术涉及网络资产管理,尤其涉及一种企业ip资产识别的方法及电子设备。
背景技术:
1、在现代网络资产竞争中,企业ip资产的识别和拓线至关重要,企业ip资产的识别和拓线的好坏直接影响企业的品牌保护和市场竞争力。随着网络环境的复杂多变,企业面临着不断增加的网络攻击和信息泄露的风险。因此,及时、全面地识别和管理企业的ip资产,已成为确保企业安全与竞争优势的重要任务。
2、现有的企业ip资产识别方法主要是基于网站数据,对企业ip资产进行查找匹配,当匹配信息完全一致时才能确定ip资产是否属于该企业,但网站中存在某些数据历史源ip属于该企业,但与查询的信息不完全一致的情况下,此时并不能准确识别出该ip资产属于该企业。因此,这种方法在复杂的网络环境下,无法有效整合和利用网站中的多种数据历史源ip,从而影响识别ip资产的全面性和准确性。
技术实现思路
1、本技术提供一种企业ip资产识别的方法及电子设备,用以解决无法全面地识别企业ip资产的问题。
2、第一方面,提供了企业ip资产识别的方法,所述方法包括:
3、获取待识别的目标企业的目标标识信息;根据互联网内容icp数据库记录中的各个企业标识信息各自与第一域名的对应关系,确定所述目标标识信息对应的目标域名;
4、根据预先构建的图谱中的各条查找路径,确定以所述目标域名为源节点,ip为终止节点的目标查找路径;其中,所述图谱是基于网站数据和pdns数据构建的;
5、根据预先保存的各个节点的第一特征向量,确定所述目标查找路径中每个目标节点的目标特征向量;将所述每个目标节点的目标特征向量输入预先训练完成的资产序列分类模型,基于所述资产序列分类模型确定所述ip和所述目标域名是否属于同一企业资产。
6、进一步地,预先构建所述图谱的过程包括:
7、根据所述icp数据库中记录的各个企业标识信息及各自对应的第一域名,以及网络数据库和域名系统dns数据库,确定各个企业的网站数据和pdns数据;
8、以所述各个企业的网站数据和pdns数据作为节点,构造图结构;
9、根据预先保存的所述图结构中各节点之间的查找关系,确定所述图结构中的每条源节点至终止节点的查找路径,并根据每条查找路径构建图谱。
10、进一步地,以所述各个企业的网站数据和pdns数据作为节点,构造图结构包括:
11、针对所述各个企业,以所述企业的网站数据和pdns数据作为节点,根据预设的连接规则,构建所述企业的子图结构;
12、针对所述各个企业的子图结构,将所述子图结构中的类型为域名或ip的节点作为第一待连接节点;
13、将不同的子图结构,根据相同的第一待连接节点进行连接,构建所述图结构。
14、进一步地,所述pdns数据包括:第二域名、所述第二域名对应的至少一个第三域名、所述第二域名和所述至少一个第三域名各自对应的第一ip;所述网站数据包括:统一资源定位符url、第四域名、证书cert和第二ip;
15、根据预设的连接规则,构建所述企业的子图结构包括:
16、所述第二域名与所述至少一个第三域名连接;所述第二域名和所述至少一个第三域名分别与对应的第一ip连接;所述统一资源定位符url分别与所述第四域名、所述证书cert、所述第二ip连接;
17、将pdns数据和网站数据中的类型为域名或ip的数据作为第二待连接节点;将相同的第二待连接节点连接,构建所述子图结构。
18、进一步地,预先保存各个节点的第一特征向量的过程包括:
19、确定所述图谱中各个节点的初始特征向量;
20、针对所述图谱中的各条查找路径,根据预设的滑动窗口确定所述查找路径的各个子查找路径;
21、针对所述各个子查找路径,将所述子查找路径中除中心节点之外的节点的初始特征向量相加,得到第二特征向量;将所述第二特征向量输入向量预测模型,基于所述向量预测模型,确定预测特征向量;根据所述预测特征向量和所述中心节点的初始特征向量,确定第一损失值;根据所述第一损失值和模型参数更新算法,对所述向量预测模型的模型参数及除所述中心节点之外的节点的初始特征向量进行更新,得到除所述中心节点之外的节点的第一特征向量。
22、进一步地,预先训练所述资产序列分类模型的过程包括:
23、根据所述预先构建的图谱中的各条查找路径,确定样本查找路径;根据预先保存的所述各个节点的第一特征向量,确定所述样本查找路径中各个样本节点的第一特征向量;
24、将所述各个样本节点的第一特征向量和所述样本查找路径的企业所属关系标签,输入待训练的资产序列分类模型,基于所述资产序列分类模型预测所述样本查找路径的企业所属关系置信度;根据所述企业所属关系标签和所述企业所属关系置信度,确定第二损失值;根据所述第二损失值对所述资产序列分类模型进行训练。
25、进一步地,基于所述资产序列分类模型预测所述样本查找路径的企业所属关系置信度包括:
26、基于所述资产序列分类模型,对所述各个样本节点的第一特征向量进行均值池化,得到第三特征向量;基于所述第三特征向量预测所述样本查找路径的企业所属关系置信度。
27、进一步地,根据所述第二损失值对所述资产序列分类模型进行训练之前,所述方法还包括:
28、将所述各个样本节点的类型标签,输入待训练的资产序列分类模型,基于所述资产序列分类模型中的类型提取子网络对所述各个样本节点的第一特征向量进行特征提取,得到所述各个样本节点的第一类型特征向量;根据所述各个样本节点的第一类型特征向量预测所述各个样本节点的类型置信度;根据所述各个样本节点的类型标签和所述各个样本节点的类型置信度,确定第三损失值;
29、根据所述第二损失值对所述资产序列分类模型进行训练包括:
30、确定所述第二损失值和第三损失值的和值,将所述和值更新为第二损失值,根据更新的第二损失值对所述资产序列分类模型进行训练。
31、进一步地,根据所述各个样本节点的第一类型特征向量预测所述各个样本节点的类型置信度包括:
32、针对所述各个样本节点,将所述样本节点的第一类型特征向量,和上一样本节点的第一类型特征向量进行拼接,得到第二类型特征向量;将所述第二类型特征向量更新为所述样本节点的第一类型特征向量,根据所述样本节点的更新后的第一类型特征向量预测所述样本节点的类型置信度。
33、第二方面,提供了一种企业ip资产识别的装置,所述装置包括:
34、处理模块,用于获取待识别的目标企业的目标标识信息;
35、确定模块,用于根据互联网内容icp数据库记录中的各个企业标识信息各自与第一域名的对应关系,确定所述目标标识信息对应的目标域名;根据预先构建的图谱中的各条查找路径,确定以所述目标域名为源节点,ip为终止节点的目标查找路径;其中,所述图谱是基于网站数据和pdns数据构建的;根据预先保存的各个节点的第一特征向量,确定所述目标查找路径中每个目标节点的目标特征向量;将所述每个目标节点的目标特征向量输入预先训练完成的资产序列分类模型,基于所述资产序列分类模型确定所述ip和所述目标域名是否属于同一企业资产。
36、进一步地,所述确定模块,具体用于根据所述icp数据库中记录的各个企业标识信息及各自对应的第一域名,以及网络数据库和域名系统dns数据库,确定各个企业的网站数据和pdns数据;
37、所述处理模块,具体用于以所述各个企业的网站数据和pdns数据作为节点,构造图结构;根据预先保存的所述图结构中各节点之间的查找关系,确定所述图结构中的每条源节点至终止节点的查找路径,并根据每条查找路径构建图谱。
38、进一步地,所述处理模块,具体用于针对所述各个企业,以所述企业的网站数据和pdns数据作为节点,根据预设的连接规则,构建所述企业的子图结构;针对所述各个企业的子图结构,将所述子图结构中的类型为域名或ip的节点作为第一待连接节点;将不同的子图结构,根据相同的第一待连接节点进行连接,构建所述图结构。
39、进一步地,所述处理模块,具体用于所述第二域名与所述至少一个第三域名连接;所述第二域名和所述至少一个第三域名分别与对应的第一ip连接;所述统一资源定位符url分别与所述第四域名、所述证书cert、所述第二ip连接;将pdns数据和网站数据中的类型为域名或ip的数据作为第二待连接节点;将相同的第二待连接节点连接,构建所述子图结构。
40、进一步地,所述确定模块,具体用于确定所述图谱中各个节点的初始特征向量;针对所述图谱中的各条查找路径,根据预设的滑动窗口确定所述查找路径的各个子查找路径;
41、所述处理模块,具体用于针对所述各个子查找路径,将所述子查找路径中除中心节点之外的节点的初始特征向量相加,得到第二特征向量;将所述第二特征向量输入向量预测模型,基于所述向量预测模型,确定预测特征向量;根据所述预测特征向量和所述中心节点的初始特征向量,确定第一损失值;根据所述第一损失值和模型参数更新算法,对所述向量预测模型的模型参数及除所述中心节点之外的节点的初始特征向量进行更新,得到除所述中心节点之外的节点的第一特征向量。
42、进一步地,所述确定模块,具体用于根据所述预先构建的图谱中的各条查找路径,确定样本查找路径;根据预先保存的所述各个节点的第一特征向量,确定所述样本查找路径中各个样本节点的第一特征向量;
43、所述处理模块,具体用于将所述各个样本节点的第一特征向量和所述样本查找路径的企业所属关系标签,输入待训练的资产序列分类模型,基于所述资产序列分类模型预测所述样本查找路径的企业所属关系置信度;根据所述企业所属关系标签和所述企业所属关系置信度,确定第二损失值;根据所述第二损失值对所述资产序列分类模型进行训练。
44、进一步地,所述处理模块,具体用于基于所述资产序列分类模型,对所述各个样本节点的第一特征向量进行均值池化,得到第三特征向量;基于所述第三特征向量预测所述样本查找路径的企业所属关系置信度。
45、进一步地,所述处理模块,还用于将所述各个样本节点的类型标签,输入待训练的资产序列分类模型,基于所述资产序列分类模型中的类型提取子网络对所述各个样本节点的第一特征向量进行特征提取,得到所述各个样本节点的第一类型特征向量;根据所述各个样本节点的第一类型特征向量预测所述各个样本节点的类型置信度;根据所述各个样本节点的类型标签和所述各个样本节点的类型置信度,确定第三损失值;根据所述第二损失值对所述资产序列分类模型进行训练包括:确定所述第二损失值和第三损失值的和值,将所述和值更新为第二损失值,根据更新的第二损失值对所述资产序列分类模型进行训练。
46、进一步地,所述处理模块,具体用于针对所述各个样本节点,将所述样本节点的第一类型特征向量,和上一样本节点的第一类型特征向量进行拼接,得到第二类型特征向量;将所述第二类型特征向量更新为所述样本节点的第一类型特征向量,根据所述样本节点的更新后的第一类型特征向量预测所述样本节点的类型置信度。
47、第三方面,提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
48、所述存储器,用于存放计算机程序;
49、所述处理器,用于执行所述存储器上所存放的程序时,实现上述任一项所述的方法。
50、第四方面,提供了一种计算机可读存储介质,所述存储介质中存储有计算机程序或指令,当所述计算机程序或指令被通信装置执行时,实现上述任一项所述的方法。
51、第五方面,提供了一种计算机程序产品,所述计算机程序产品包括:计算机程序代码,当所述计算机程序代码在计算机上运行时,实现上述任一项所述的方法。
52、在本技术实施例中,通过网站数据和pdns数据构建的图谱,基于构建的图谱,确定以待识别企业对应的目标域名为源节点、ip为终止节点的目标查找路径,根据预先保存图谱中每个节点的第一特征向量,基于预先训练完成的资产序列分类模型,将目标查找路径中每个目标节点的目标特征向量输入至资产序列分类模型,确定ip和目标域名是否属于同一企业资产,从而实现对企业ip资产的识别。相比基于网站数据,对企业ip资产进行查找匹配,当匹配信息完全一致时才能确定ip资产是否属于该企业而言,本技术通过结合pdns数据中保存的历史数据,基于网站数据构建的图谱,全面地获取了网站数据中数据历史源ip,有效的整合了复杂网络环境下的多种数据历史源ip,从而保证了识别ip资产的全面性和准确性。
1.一种企业ip资产识别的方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,预先构建所述图谱的过程包括:
3.根据权利要求2所述的方法,其特征在于,以所述各个企业的网站数据和pdns数据作为节点,构造图结构包括:
4.根据权利要求3所述的方法,其特征在于,所述pdns数据包括:第二域名、所述第二域名对应的至少一个第三域名、所述第二域名和所述至少一个第三域名各自对应的第一ip;所述网站数据包括:统一资源定位符url、第四域名、证书cert和第二ip;
5.根据权利要求1所述的方法,其特征在于,预先保存各个节点的第一特征向量的过程包括:
6.根据权利要求1所述的方法,其特征在于,预先训练所述资产序列分类模型的过程包括:
7.根据权利要求6所述的方法,其特征在于,基于所述资产序列分类模型预测所述样本查找路径的企业所属关系置信度包括:
8.根据权利要求6所述的方法,其特征在于,根据所述第二损失值对所述资产序列分类模型进行训练之前,所述方法还包括:
9.根据权利要求8所述的方法,其特征在于,根据所述各个样本节点的第一类型特征向量预测所述各个样本节点的类型置信度包括:
10.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
