[发明专利]两方数据安全碰撞方法和系统在审
| 申请号: | 201910403102.0 | 申请日: | 2019-05-15 |
| 公开(公告)号: | CN110263555A | 公开(公告)日: | 2019-09-20 |
| 发明(设计)人: | 姚平;徐杰;姚雷;牛宝梅 | 申请(专利权)人: | 苏宁易购集团股份有限公司 |
| 主分类号: | G06F21/60 | 分类号: | G06F21/60 |
| 代理公司: | 北京市万慧达律师事务所 11111 | 代理人: | 黄玉东 |
| 地址: | 210000 江*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 数组 数据安全 初始参数 第一数据 计算设备 映射函数 原始数据 泄露 公共集合 公有数据 数据碰撞 数据集 映射 申请 筛选 保证 | ||
本申请涉及一种两方数据安全碰撞方法和系统,该方法包括:获取初始参数;根据所述初始参数确定数组的长度和映射函数的个数;根据映射函数将所述第一数据集映射为第一数组;将所述第一数组发送到第二计算设备,以使第二计算设备根据所述第一数组筛选出所述第一数据集与第二数据集的公共集合。本申请的方案保证了数据碰撞过程中,双方都不能获取对方的原始数据;在不泄露原始数据的情况下,双方可以且仅仅可以识别公有数据,双方的非公有数据都不会泄露给对方,保证了数据安全。
技术领域
本申请属于数据交换技术领域,具体涉及一种两方数据安全碰撞方法和系统。
背景技术
企业通常都拥有大量的数据,比如提供互联网服务的各种社交软件的开发公司,会拥有大量的用户数据。各公司都将自己的数据作为核心资产进行保护,防止泄露。但是在很多业务场景下,两个公司可能需要对相同类型的数据求交集,比如寻找双方共同用户、共同IP黑名单等。
相关技术中,有两种方案来求数据交集:
1、通过第三方平台进行,由第三方接收双方的数据,求数据交集后,再分别发给双方。此方案的问题在于,需要对第三方有足够的信任,信任其不会泄露双方的数据;同时要签订相关的合同,流程较长,对于业务推进不利。
2、双方直接进行数据交换。具体做法是,双方将数据进行hash后,相互交换hash值,相同hash值对应的原始数据作为公共数据。此方案的问题在于不够安全,如果数据集的取值范围不够大,比如都是手机号码,那么很容易根据hash值倒推出原始的数据,因此会泄露非公共数据给对方。
发明内容
基于相关技术中存在的缺陷,本申请提供一种两方数据安全碰撞方法和系统。
根据本申请的第一方面,提供一种两方数据安全碰撞方法,该方法应用于能够访问第一数据集的第一计算设备,包括:
获取初始参数;
根据所述初始参数确定数组的长度和映射函数的个数;
根据映射函数将所述第一数据集映射为第一数组;
将所述第一数组发送到第二计算设备,以使第二计算设备根据所述第一数组筛选出所述第一数据集与第二数据集的公共集合。
进一步地,所述初始参数包括:数据量和错误率;
相应地,所述获取初始参数,包括:
访问第一数据集,获取第一数据集的第一数据量;
接收第二计算设备发送的第二数据集的第二数据量;
根据所述第一数据量和所述第二数据量确定所述数据量。
进一步地,所述根据所述第一数据量和所述第二数据量确定所述数据量,包括:
将所述第一数据量和所述第二数据量中的较大值确定为所述数据量。
进一步地,所述根据所述初始参数确定数组的长度和映射函数的个数,包括:
根据所述数据量和所述错误率确定数组的长度;
根据所述错误率确定映射函数的个数。
进一步地,所述根据所述数据量和所述错误率确定数组的长度,包括:
数组的长度
其中,n为所述数据量,err为所述错误率。
进一步地,所述根据所述错误率确定映射函数的个数,包括:
映射函数的个数
其中,err为所述错误率。
进一步地,所述映射函数为hash函数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏宁易购集团股份有限公司,未经苏宁易购集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910403102.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种低计算能力设备存储加密方法
- 下一篇:一种OA系统数据的加解密方法及系统





