本发明涉及隐私计算,具体而言,涉及一种目标数据预测方法及系统。
背景技术:
1、目前,横向联邦学习技术在模型训练阶段面临参与方数据集、模型参数的隐私保护及系统性能平衡问题;在推理预测阶段则面临被预测用户数据和模型参数的隐私保护以及推理结果正确性验证的问题。现有技术在隐私保护和性能平衡方面存在不足,难以满足高效、安全的联邦学习应用需求。
2、针对现有技术在隐私保护和性能平衡方面存在不足的问题,目前尚未提出有效的解决方案。
技术实现思路
1、本发明实施例中提供一种目标数据预测方法及系统,以解决现有技术在隐私保护和性能平衡方面存在不足的问题。
2、为达到上述目的,一方面,本发明提供了一种目标数据预测方法,该方法包括:s1、多个参与方分别基于各自的数据集和初始模型系数进行模型训练,得到各自的模型系数;所述数据集包括特征数据和目标数据;所述多个参与方包括任务发方起、聚合密文生成方和其他参与方;
3、s2、每个参与方对其各自的模型系数进行同态加密,分别生成各自的初始密文向量;s3、由聚合密文生成方获取自身及其他参与方基于同态授权密钥算法生成的各自的授权密钥;s4、聚合密文生成方将自身的初始密文向量、授权密钥和任务发起方发来的初始密文向量、其他参与方发来的初始密文向量及授权密钥基于同态授权转换子算法和同态加法子算法,生成模型聚合密文并发送给任务发起方,任务发起方基于同态授权解析子算法解密及求均值得到模型系数聚合均值,将模型系数聚合均值发送给聚合密文生成方及其他参与方;s5、根据模型系数聚合均值和每个参与方的模型系数判断模型系数聚合均值对应的模型是否收敛;s6、若不收敛,则将模型系数聚合均值作为初始模型系数重复进行s1~s5,直至模型收敛;将收敛模型对应的模型系数聚合均值作为目标模型系数;s7、将所有参与方中的其中一方作为模型拥有方,所述模型拥有方基于自身的目标模型系数和模型使用方的特征数据采用同态代理重加密算法进行预测,得到模型使用方的目标数据。
4、可选的,在所述s1之前还包括:获取公共参数;每个参与方基于公共参数和密钥生成算法生成各自的公私钥对。
5、可选的,所述s7包括:所述模型拥有方对自身的目标模型系数进行同态加密,生成第一密文向量,并将其发送给模型使用方;所述模型使用方将自身的特征数据和第一密文向量基于同态加法子算法,生成同态模型推理密文;所述模型拥有方获取模型使用方的公钥、同态模型推理密文,并将模型使用方的公钥和自身的私钥基于同态授权密钥算法生成授权使用密钥,并将授权使用密钥、同态模型推理密文基于同态授权转换子算法,生成模型授权推理密文,将模型授权推理密文发送给模型使用方;所述模型使用方将模型授权推理密文、自身的私钥基于同态授权解密子算法生成模型使用方的目标数据。
6、可选的,在所述s7之后还包括:将模型拥有方的目标模型系数、模型使用方的特征数据和模型使用方的目标数据基于安全两方计算协议和零知识证明协议联合计算,生成满足预设关系式的证明π;模型使用方基于零知识证明协议校验所述证明π,若验证通过,则预测的模型使用方的目标数据正确。
7、可选的,所述s3包括:聚合密文生成方及其他参与方分别获取任务发起方的公钥,并分别将任务发起方的公钥和自身的私钥基于同态授权密钥算法生成各自的授权密钥,其他参与方并将自身的授权密钥发送给聚合密文生成方。
8、可选的,所述s4包括:聚合密文生成方将自身的初始密文向量及其授权密钥基于同态授权转换子算法生成自身的授权密文,并将其他参与方发来的初始密文向量及其授权密钥基于同态授权转换子算法生成其他参与方的授权密文;聚合密文生成方将任务发起方的初始密文向量、聚合密文生成方的授权密文和其他参与方的授权密文基于同态加法子算法生成模型聚合密文,并发送给任务发起方;任务发起方基于自身的私钥和同态授权解析子算法对所述模型聚合密文进行解密得到模型系数聚合和值;任务发起方将所述模型系数聚合和值求平均值得到模型系数聚合均值,并将模型系数聚合均值发送给聚合密文生成方及其他参与方。
9、可选的,所述s5包括:判断每个参与方的模型系数和模型系数聚合均值的欧几里得距离是否均在预设阈值内;若是,则判定模型系数聚合均值对应的模型收敛,反之,则不收敛。
10、另一方面,本发明提供了一种目标数据预测系统,该系统包括:模型训练单元,用于多个参与方分别基于各自的数据集和初始模型系数进行模型训练,得到各自的模型系数;所述数据集包括特征数据和目标数据;所述多个参与方包括任务发方起、聚合密文生成方和其他参与方;
11、同态加密单元,用于每个参与方对其各自的模型系数进行同态加密,分别生成各自的初始密文向量;授权密钥生成单元,用于由聚合密文生成方获取自身及其他参与方基于同态授权密钥算法生成的各自的授权密钥;模型系数聚合均值生成单元,用于聚合密文生成方将自身的初始密文向量、授权密钥和任务发起方发来的初始密文向量、其他参与方发来的初始密文向量及授权密钥基于同态授权转换子算法和同态加法子算法,生成模型聚合密文并发送给任务发起方,任务发起方基于同态授权解析子算法解密及求均值得到模型系数聚合均值,将模型系数聚合均值发送给聚合密文生成方及其他参与方;判断单元,用于根据模型系数聚合均值和每个参与方的模型系数判断模型系数聚合均值对应的模型是否收敛;迭代单元,用于若不收敛,则将模型系数聚合均值作为初始模型系数重复进行模型训练单元、同态加密单元、授权密钥生成单元、模型系数聚合均值生成单元、判断单元,直至模型收敛;将收敛模型对应的模型系数聚合均值作为目标模型系数;预测单元,用于将所有参与方中的其中一方作为模型拥有方,所述模型拥有方基于自身的目标模型系数和模型使用方的特征数据采用同态代理重加密算法进行预测,得到模型使用方的目标数据。
12、可选的,所述预测单元包括:同态加密子单元,用于所述模型拥有方对自身的目标模型系数进行同态加密,生成第一密文向量,并将其发送给模型使用方;同态加法子单元,用于所述模型使用方将自身的特征数据和第一密文向量基于同态加法子算法,生成同态模型推理密文;同态授权密钥子单元,用于所述模型拥有方获取模型使用方的公钥,并将模型使用方的公钥和自身的私钥基于同态授权密钥算法生成授权使用密钥;同态授权转换子单元,用于所述模型拥有方将授权使用密钥、同态模型推理密文基于同态授权转换子算法,生成模型授权推理密文,将模型授权推理密文发送给模型使用方;同态授权解密子单元,用于所述模型使用方将模型授权推理密文、自身的私钥基于同态授权解密子算法生成模型使用方的目标数据。
13、可选的,还包括:验证单元,用于将模型拥有方的目标模型系数、模型使用方的特征数据和模型使用方的目标数据基于安全两方计算协议和零知识证明协议联合计算,生成满足预设关系式的证明π;模型使用方基于零知识证明协议校验所述证明π,若验证通过,则预测的模型使用方的目标数据正确。
14、本发明的有益效果:
15、本发明提供了一种目标数据预测方法及系统,通过引入同态代理重加密技术,在模型训练和推理过程中,无需直接访问参与方的原始数据,有效避免了数据泄露的风险,确保了参与方数据的隐私性和安全性;通过采用安全两方计算协议和零知识证明协议,使得在不公开模型拥有方的模型系数和模型使用方的特征数据的情况下,能够验证预测的模型使用方的目标数据的正确性,从而保证了推理结果的可信性;通过使用同态加密技术,本发明在实现数据隐私保护的同时,能够有效执行分布式计算任务,减少了各方之间的数据交换量,提高了系统的整体性能和计算效率。
1.一种目标数据预测方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,在所述s1之前还包括:
3.根据权利要求1所述的方法,其特征在于,所述s7包括:
4.根据权利要求3所述的方法,其特征在于,在所述s7之后还包括:
5.根据权利要求2所述的方法,其特征在于,所述s3包括:
6.根据权利要求2所述的方法,其特征在于,所述s4包括:
7.根据权利要求1所述的方法,其特征在于,所述s5包括:
8.一种目标数据预测系统,其特征在于,包括:
9.根据权利要求8所述的系统,其特征在于,所述预测单元包括:
10.根据权利要求8所述的系统,其特征在于,还包括: