[发明专利]用于安全隐私数据聚合的设备和方法在审
| 申请号: | 202180038368.5 | 申请日: | 2021-04-01 | 
| 公开(公告)号: | CN115956244A | 公开(公告)日: | 2023-04-11 | 
| 发明(设计)人: | 詹姆斯·里德·戴斯蒙德·亚瑟;卢克·安东尼·威廉·罗宾逊;哈里·理查德·基恩 | 申请(专利权)人: | 朦胧有限公司 | 
| 主分类号: | G06F21/62 | 分类号: | G06F21/62 | 
| 代理公司: | 深圳尚业知识产权代理事务所(普通合伙) 44503 | 代理人: | 文蓉 | 
| 地址: | 英国肯特塞文奥克斯巴克赫*** | 国省代码: | 暂无信息 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 用于 安全 隐私 数据 聚合 设备 方法 | ||
一种能够对多个原始数据集进行分析,同时保护原始数据集内的信息的隐私的计算机系统,该系统包括多个合成数据生成器和数据集线器。每个合成数据生成器被配置为:访问存储在多个原始数据存储中的对应的一个原始数据存储中的对应的原始数据集;基于所述对应的原始数据集产生合成数据生成器模型,所述合成数据生成器模型被配置为生成表示所述对应的原始数据集的合成数据集;以及将包括所述对应的合成数据集和所述合成数据生成器模型中的至少一个的合成信息推送到所述数据集线器。所述数据集线器被配置成存储从所述合成数据生成器接收的所述合成信息以供一个或多个客户端访问以进行分析。所述系统被配置成使得所述数据集线器不能直接访问所述原始数据集,并且使得所述合成数据信息只能从所述合成数据生成器推送到所述数据集线器。
技术领域
本公开涉及能够对多个原始数据集进行分析同时保护原始数据集内的信息的隐私的计算机系统和计算机实施方法。特别地,但不限于,本公开涉及能够对来自多个安全源的匿名数据进行安全分析和建模而不损害原始数据源的安全性或隐私的装置。
背景技术
机器学习和数据分析的进步,见证了原始数据价值的增长。随着原始数据价值的增长,维护数据安全性变得越来越重要,不仅是为了安全,也是为了维护隐私和遵守当地法规。
虽然单个数据集可能足以训练用于一些应用的机器学习系统,但是在某些情况下,可以通过增加训练数据集的大小来显著改善性能。单个公司通常难以获得足够量的数据来有效地训练机器学习模型。因此,可以通过组合来自不同来源(例如,来自不同公司)的数据来获得性能的改进。
如上所述,考虑到原始数据的价值和维护隐私的要求,重要的是维护数据安全性。一些计算机系统具有严格的中国墙来保护信息并遵守当地法规(例如,在银行业内)。同样,由于需要维护用户隐私,许多公司和研究组不能共享原始的非匿名数据。这可能使得跨不同数据源间的数据分析变得困难。
发明内容
鉴于上述情况,需要一种收集或聚合来自不同源的数据并分析数据,同时保持原有的原始数据的安全性和隐私的改进的手段。当数据是在可信计算环境之外或在彼此不完全信任的用户或系统之间共享的情况下,这是特别重要的。例如,个人数据可以受到法律或法规的保护,在实体之间(例如企业之间)或跨境共享数据可能被禁止。
解决此问题的一个方法是利用联合机器学习。尽管如此,联合机器学习存在关于跨多个源的归一化数据以及给予系统对每个数据源的访问的要求的问题。此外,联合机器学习可能存在关于共享预测误差的隐私问题。此外,联合机器学习不允许将不同的隐私约束应用于不同的信息源。
为了解决上述问题,本文描述的实施例通过生成和共享合成数据来保护在原始数据中表示的个体的隐私,所述合成数据共享原始数据的属性,但不损害原有的原始数据的安全性或隐私。本文描述的具体实施例通过在可信环境内实施合成数据生成器并在数据集线器中跨多个源收集合成数据来提高数据安全性并减少网络的攻击面。数据集线器可以充当保护原始数据源免受攻击的基础主机,从而减少网络的攻击面。
为了保护原始数据源,网络被配置成使得合成数据只能从合成数据生成器推送,并且因此不能通过数据集线器从合成数据生成器拉取。客户(例如,数据科学家)可以经由数据集线器从多个源访问合成生成的数据,以分析数据(例如,在合成数据上训练机器学习模型)。
此外,为了保护原始数据源中引用的个体的隐私,所述合成生成器可以被配置为生成所述合成数据,以便符合设定的隐私级别(例如,设定的差异隐私级别)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于朦胧有限公司,未经朦胧有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202180038368.5/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





