本发明属于密码学,涉及一种支持集合实时更新的非平衡隐私集合求交系统。
背景技术:
1、随着云计算技术的迅猛发展和隐私保护需求的日益增加,一系列应用场景如私人接触追踪、在线广告精准投放以及数据挖掘等,都对数据处理提出了更高要求。在这些应用场景中,一个常见的需求就是求取参与者所拥有数据集合的交集,并且必须确保除了交集信息以外,不泄露任何额外的数据内容。隐私集合求交(private set intersection,psi)技术恰好能够满足这些应用场景的迫切需求,它允许参与方在保护各自数据隐私的前提下,共同计算出它们所持有数据集合的交集。
2、然而,在实际应用中,参与方的数据集往往呈现出不平衡的特性,即一个数据集的大小可能远远超过另一个数据集。这种不平衡性给隐私集合求交带来了挑战。此外,现实世界中的数据集是不断动态变化的,数据更新频繁,且更新后需要迅速获取到最新的交集结果。传统的隐私集合求交协议在处理这种不平衡且频繁更新的数据时,往往效率低下,难以满足实际应用场景的需求。
3、现有的不平衡psi协议主要是为静态数据集设计的,当数据集不断更新时,这些协议会产生巨大的计算和通信开销,导致性能瓶颈。为了解决这个问题,一些方法尝试通过填充虚拟元素或使用同态加密等技术来减少计算和通信开销,但这些方法仍然存在显著的性能问题和安全隐患,无法完全满足实际应用场景的需求。
4、当前隐私集合求交协议在实际应用中主要面临2个关键挑战:1)在非平衡数据集下,协议计算与通信效率不高;2)非平衡隐私求交协议难以适应动态更新数据集场景。因此,提升协议计算与通信效率,推动隐私集合求交技术向动态不平衡数据集的发展,成为了一个亟待解决的问题。通过研发更加高效、安全的隐私集合求交协议,可以为云服务提供更好的隐私保护,满足实际应用场景对数据处理的高效性和隐私性的双重需求。这不仅将促进云计算技术的进一步发展,还将为个人隐私保护和数据安全提供有力保障。
技术实现思路
1、有鉴于此,本发明的目的在于提供一种支持集合实时更新的非平衡隐私集合求交系统,该系统允许参与方实时安全地更新其集合,并有效地确保增量更新的保密性和完整性,便于动态集合管理而不会泄露单个集合元素。
2、为达到上述目的,本发明提供如下技术方案:
3、一种支持集合实时更新的非平衡隐私集合求交系统,该系统包括三个实体单元:数据提供方、客户端和安全处理管道;其中数据提供方和客户端分别发送加密数据流给安全处理管道,且客户端希望知道其输入集合与数据提供方输入集合的交集;所述安全处理管道由两个不可合谋的服务器组成,为核心计算组件,用于安全地处理数据并提供交集结果;客户端和数据提供方之间没有直接的通信,本系统执行协议包含初始化阶段、客户端更新阶段和数据提供方更新阶段。
4、进一步,所述初始化阶段仅在参与方首次建立通信时进行,包括:数据提供方生成加密密钥并且生成相应的附加份额发送给安全处理管道;客户端随机生成一个哈希表发送给安全处理管道。
5、进一步,所述客户端更新阶段为客户端更新数据并且客户端收到结果的阶段,包括:客户端和安全处理管道进行不经意交互得到新增元素的加密形式;客户端更新哈希表并发送给安全处理管道,所述哈希表是用于存储和处理客户端输入集合的元素的数据结构,以便于后续的交集计算;安全处理管道计算交集并发送结果给客户端。
6、进一步,所述数据提供方更新阶段为数据提供方更新数据,并且给客户端推送结果的阶段,包括:数据提供方对新增元素进行加密并且发送给安全处理管道;安全处理管道计算交集并发送结果给客户端。
7、进一步,所述加密数据流是通过特定的加密算法生成的,以确保数据的机密性和完整性。
8、进一步,所述不经意交互是通过不经意伪随机函数(oblivious pseudorandomfunctions,oprf)或其他类似的隐私保护技术实现的,以保护新增元素的隐私性。这种函数被视为一个带有密钥的哈希函数。在这种协议中,只有发送方知道密钥s,接收方可以获取oprf(s,x)而不知道函数oprf(s,-)或密钥s,发送方也不会知道x,其中x是接收方发送的数据。
9、进一步,所述交集结果是通过安全的多方计算技术或其他类似的隐私保护技术计算得出的,以确保计算过程的机密性和结果的准确性。
10、本发明的有益效果在于:
11、本发明提供了一种支持集合实时更新的非平衡隐私集合求交系统,本发明中的psi协议具有高效性、实时性和强隐私保护的特点。该方案基于分布式点函数和不经意伪随机函数,能够在动态数据环境中有效运行。在真实世界的数据集上实施和评估了该方案,验证了其有效性和性能,与现有的不平衡隐私集合求交协议相比,本发明方案在计算和通信成本上表现出显著优势。具体而言,本方案在带宽和存储开销方面分别减少了多达24倍和31倍,同时保持较低的计算延迟和通信延迟。例如,对于由服务器管理的大型集合(包含一百万个元素),添加4096个元素的运行时间为31毫秒;而对于由客户端管理的小型集合(包含一千个元素),添加64个元素的运行时间仅为32毫秒。此外,本方案还确保了数据的保密性和完整性,避免了数据泄露和安全漏洞的风险,使其在处理大规模流数据和实时更新场景中表现尤为出色。
12、本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。
1.一种支持集合实时更新的非平衡隐私集合求交系统,其特征在于:该系统包括三个实体单元:数据提供方、客户端和安全处理管道;其中数据提供方和客户端分别发送加密数据流给安全处理管道,且客户端希望知道其输入集合与数据提供方输入集合的交集;所述安全处理管道由两个不可合谋的服务器组成,为核心计算组件,用于安全地处理数据并提供交集结果;客户端和数据提供方之间没有直接的通信,本系统执行协议包含初始化阶段、客户端更新阶段和数据提供方更新阶段。
2.根据权利要求1所述的一种支持集合实时更新的非平衡隐私集合求交系统,其特征在于:所述初始化阶段仅在参与方首次建立通信时进行,包括:数据提供方生成加密密钥并且生成相应的附加份额发送给安全处理管道;客户端随机生成一个哈希表发送给安全处理管道。
3.根据权利要求2所述的一种支持集合实时更新的非平衡隐私集合求交系统,其特征在于:所述客户端更新阶段为客户端更新数据并且客户端收到结果的阶段,包括:客户端和安全处理管道进行不经意交互得到新增元素的加密形式;客户端更新哈希表并发送给安全处理管道,所述哈希表是用于存储和处理客户端输入集合的元素的数据结构,以便于后续的交集计算;安全处理管道计算交集并发送结果给客户端。
4.根据权利要求3所述的一种支持集合实时更新的非平衡隐私集合求交系统,其特征在于:所述数据提供方更新阶段为数据提供方更新数据,并且给客户端推送结果的阶段,包括:数据提供方对新增元素进行加密并且发送给安全处理管道;安全处理管道计算交集并发送结果给客户端。
5.根据权利要求1所述的一种支持集合实时更新的非平衡隐私集合求交系统,其特征在于:所述加密数据流是通过特定的加密算法生成的,以确保数据的机密性和完整性。
6.根据权利要求3所述的一种支持集合实时更新的非平衡隐私集合求交系统,其特征在于:所述不经意交互是通过不经意伪随机函数(oblivious pseudorandom functions,oprf)或其他类似的隐私保护技术实现的,以保护新增元素的隐私性。
7.根据权利要求3所述的一种支持集合实时更新的非平衡隐私集合求交系统,其特征在于:所述交集结果是通过安全的多方计算技术或其他类似的隐私保护技术计算得出的,以确保计算过程的机密性和结果的准确性。