本技术涉及风控模型,尤其涉及一种跨行业风控模型验证方法、装置、设备及存储介质。
背景技术:
1、机器学习即服务(mlaas)是在云计算背景下崛起的一项创新服务,近几年迅速改变着多个行业的数据处理和决策方式。mlaas为企业和开发者提供了便捷的途径,以利用先进的机器学习算法和模型,而无需深入专业知识或昂贵的硬件资源。在这一服务模型中,业界领先的云服务提供商等,通过提供全面的功能,包括数据清理、模型训练、推理和其他与机器学习相关的任务,极大地简化了机器学习的整个生命周期。mlaas的兴起为各行各业的创新注入了新动力,使得在医疗、金融、自动驾驶和其他关键领域中应用机器学习技术变得更加便捷和可行。
2、当前,许多云服务提供商提供的mlaas覆盖了数据清理、训练和推理等多个环节。这为客户提供了便利,可以将计算密集型的模型训练工作外包给专业的mlaas第三方,避免了管理本地计算硬件和资源的繁琐任务。然而,随着技术的普及,mlaas的训练完整性却面临着一些不容忽视的挑战。近期的研究揭示了后门攻击的潜在威胁。这类攻击者可以在模型训练过程中操控训练数据或篡改权重,对模型的性能产生负面影响。尽管由此产生的模型在大多数情况下表现良好,但在特定输入条件下可能会产生错误的预测。特别需要关注的是,如果mlaas提供商受到后门攻击,可能会对客户在关键领域,如医疗、自动驾驶和机器人,造成严重的后果。因此,客户在选择mlaas服务时务必从自身利益出发,采取必要的措施来确保模型训练的完整性和可靠性。
3、因此,为了满足mlaas提供商和客户的共同利益,迫切需要开发一种既能为提供商提供隐私保护,又能为客户提供可验证性的mlaas方案。在现有的技术中,目前是利用现有攻击的先前知识来检测对手引起的性能降低,但这种方法没有理论保证,并且容易受到自适应后门攻击的损害。
4、因此,当前利用现有攻击的先前知识来检测对手引起的性能降低,且容易受到自适应后门攻击的损害的技术问题亟待解决。
技术实现思路
1、本技术提供了一种跨行业风控模型验证方法、装置、设备及存储介质,先通过对获取到的更新模型进行中间权重迭代计算生成更新中间权重和超参数,然后获取到随机抽样的迭代轮数组合,最后通过更新中间权重和超参数生成与迭代和训练轮数组合对应的证明数据解决了当前利用现有攻击的先前知识来检测对手引起的性能降低,且容易受到自适应后门攻击的损害的技术问题。
2、有鉴于此,本技术第一方面提供了一种跨行业风控模型验证方法,所述方法包括:
3、对获取到的更新模型进行中间权重迭代计算生成更新中间权重和超参数;
4、获取到随机抽样的迭代轮数组合;
5、通过更新中间权重和超参数生成与迭代和训练轮数组合对应的证明数据。
6、可选地,对获取到的更新模型进行中间权重迭代计算生成更新中间权重和超参数具体包括:
7、获取到更新模型和通过前一次迭代权重计算得到的中间权重;
8、通过提交函数生成更新中间权重和超参数。
9、可选地,通过提交函数生成更新中间权重和超参数具体包括:
10、通过提交函数生成超参数;
11、通过知识蒸馏算法对应的层数和层数对应的权重计算更新中间权重;
12、根据更新中间权重确定最终模型。
13、可选地,获取到随机抽样的迭代轮数组合具体包括:
14、获取到通过随机抽样生成的所述迭代轮数组合;
15、确定所述迭代轮数组合中的迭代次数和对应的特定数据样本。
16、可选地,通过更新中间权重和超参数生成与迭代和训练轮数组合对应的证明数据具体包括:
17、通过调用的证明函数、获取的公钥和零知识证明算法对更新中间权重和超参数进行计算;
18、生成与迭代轮数组合对应的证明数据。
19、可选地,生成与迭代轮数组合对应的证明数据之后还包括:
20、将所述证明数据发至客户端,使得所述客户端对所述证明数据进行验证确定是否通过验证;
21、获取到与所述证明数据对应的验证结果。
22、可选地,对获取到的更新模型进行中间权重迭代计算生成更新中间权重和超参数之前还包括:
23、建立与客户端对应的包括有训练证明和承诺证明的验证回路;
24、获取到与所述更新模型对应的公钥。
25、本技术第二方面提供一种跨行业风控模型验证装置,装置包括:
26、第一获取单元,用于对获取到的更新模型进行中间权重迭代计算生成更新中间权重和超参数;
27、第二获取单元,用于获取到随机抽样的迭代轮数组合;
28、证明数据生成单元,用于通过更新中间权重和超参数生成与迭代和训练轮数组合对应的证明数据。
29、可选地,第一获取单元具体包括:
30、第一获取子单元,用于获取到更新模型和通过前一次迭代权重计算得到的中间权重;
31、第一生成子单元,用于通过提交函数生成更新中间权重和超参数。
32、可选地,第一生成子单元具体用于:
33、通过提交函数生成超参数;
34、通过知识蒸馏算法对应的层数和层数对应的权重计算更新中间权重;
35、根据更新中间权重确定最终模型。
36、可选地,第二获取单元具体用于获取到通过随机抽样生成的包含有迭代次数和对应的特定数据样本的迭代轮数组合。
37、可选地,证明数据生成单元,具体包括:
38、证明数据计算子单元,用于通过调用的证明函数、获取的公钥和零知识证明算法对更新中间权重和超参数进行计算;
39、第二生成子单元,用于生成与迭代轮数组合对应的证明数据。
40、可选地,还包括:
41、证明数据返回单元,用于将证明数据发至客户端,使得客户端对证明数据进行验证确定是否通过验证。
42、可选地,还包括:
43、公钥获取单元,用于获取到与更新模型对应的公钥。
44、本技术第三方面提供一种跨行业风控模型验证设备,设备包括处理器以及存储器:
45、存储器用于存储程序代码,并将程序代码传输给处理器;
46、处理器用于根据程序代码中的指令,执行如上述第一方面的跨行业风控模型验证的方法的步骤。
47、本技术第四方面提供一种计算机可读存储介质,计算机可读存储介质用于存储程序代码,程序代码用于执行上述第一方面的方法。
48、从以上技术方案可以看出,本技术实施例具有以下优点:
49、本技术中,提供了一种跨行业风控模型验证方法、装置、设备及存储介质,先通过对获取到的更新模型进行中间权重迭代计算生成更新中间权重和超参数,然后获取到随机抽样的迭代轮数组合,最后通过更新中间权重和超参数生成与迭代和训练轮数组合对应的证明数据解决了当前利用现有攻击的先前知识来检测对手引起的性能降低,且容易受到自适应后门攻击的损害的技术问题。
50、同时,本技术中获取到通过随机抽样生成的包含有迭代次数和对应的特定数据样本的迭代轮数组合,以及通过调用的证明函数、获取的公钥和零知识证明算法对更新中间权重和超参数进行计算,生成与迭代轮数组合对应的证明数据,使得客户端对证明数据进行验证确定是否通过验证,解决了如果让mlaas提供商生成证明,以证明其在计算(即模型训练)中的完整性,但是mlaas提供商也希望防止他们的训练方案的超参数泄露给竞争对手的技术问题,满足了提供商保护私密超参数的需求的有益效果。
1.一种跨行业风控模型验证方法,其特征在于,包括:
2.根据权利要求1所述的跨行业风控模型验证方法,其特征在于,对获取到的更新模型进行中间权重迭代计算生成更新中间权重和超参数具体包括:
3.根据权利要求2所述的跨行业风控模型验证方法,其特征在于,通过提交函数生成所述更新中间权重和所述超参数具体包括:
4.根据权利要求1所述的跨行业风控模型验证方法,其特征在于,获取到随机抽样的迭代轮数组合具体包括:
5.根据权利要求4所述的跨行业风控模型验证方法,其特征在于,通过所述更新中间权重和所述超参数生成与所述迭代和训练轮数组合对应的证明数据具体包括:
6.根据权利要求5所述的跨行业风控模型验证方法,其特征在于,生成与所述迭代轮数组合对应的证明数据之后还包括:
7.根据权利要求5所述的跨行业风控模型验证方法,其特征在于,对获取到的更新模型进行中间权重迭代计算生成更新中间权重和超参数之前还包括:
8.一种跨行业风控模型验证装置,其特征在于,包括:
9.一种跨行业风控模型验证设备,其特征在于,所述设备包括处理器以及存储器:
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行权利要求1-7任一项所述的跨行业风控模型验证方法。