[发明专利]数据脱敏的方法及设备在审
申请号: | 201710000569.1 | 申请日: | 2017-01-03 |
公开(公告)号: | CN106599322A | 公开(公告)日: | 2017-04-26 |
发明(设计)人: | 莫倩;张博;郑兵;王升 | 申请(专利权)人: | 北京网智天元科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F21/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100048 北京市海淀区西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 方法 设备 | ||
技术领域
本发明涉及一种数据脱敏技术,具体说是一种数据脱敏的方法及设备。
背景技术
数据脱敏是指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。这样,就可以在开发、测试和其它非生产环境以及外包环境中安全地使用脱敏后的数据。[在涉及客户安全数据或者一些商业性敏感数据的情况下,在不违反系统规则条件下,对真实数据进行改造并提供测试使用,如,为保护个人隐私,公众服务机构的客户端对身份证号、手机号、卡号、客户号等个人信息都需要进行数据脱敏。中国专利2013107503350公开了一种《数据脱敏和反脱敏方法及相关设备》,其步骤包括检测对移动终端的数据写操作、对要写入移动终端的数据执行脱敏操作、对脱敏后的数据进行验证、如果脱敏后的数据符合预定义的要求则将脱敏后的数据写入到移动终端中。该方法仅适合在移动终端处理少量数据的情况,并且由于其采用数据变换的方法替换原始数据,变换后的数据不符合原有数据的生成规则,其仿真性不高,容易被设备误认出错,无法进行二次识别。例如,对于身份证号码,采用该方法脱敏后的数据完全丧失了身份证号码的特征,此时如果需要对脱敏后的数据进行二次处理,则设备无法识别此处是身份证号码。本人申请的另一中国专利2016106321819公开了一种《数据脱敏方法及相关设备》,包括定位敏感字段、建立敏感字段生成规则库、生成脱敏数据等步骤,可实现大批量、高仿真的数据脱敏处理,在大数据处理和利用的同时实现敏感、隐私数据的可靠保护。但在大数据处理和利用工作中,需要脱敏的数据往往来源于各种不同的数据库,不同数据库之间对数据结构采取不同的定义,现有技术均无法实现跨系统、在不同数据库之间的数据脱敏。
发明内容
本发明的目的是提供一种适用于多种不同结构的数据库之间跨平台、大批量、高仿真的数据脱敏的方法及设备,在大数据的高效处理和利用的同时实现敏感隐私数据的可靠保护。
本发明所述数据脱敏的方法,包括如下步骤:
A)分析源数据,配置敏感策略,形成敏感信息表达式;
B)扫描源数据,依据敏感信息表达式抽取源数据中的敏感信息,生成敏感信息的键-值对;
C)将步骤B)得到的敏感信息的键-值对输入到非结构化数据仓库;
D)对非结构化数据仓库中敏感信息的键-值对进行仿真数据脱敏,得到仿真信息的键-值对;
E)将仿真信息的键-值对分发至目标数据库,生成脱敏数据库。
所述键-值对由代表数据存储空间的“键”和代表数据本身的“值”构成,所述数据存储空间可以是物理存储器的地址,也可以是结构化数据库中数据的位置。
所述目标数据库存储除敏感信息以外的所有源数据,所述将仿真信息的键-值对分发至目标数据库的过程就是按照仿真信息键-值对中的“键”寻找物理存储器的地址或者结构化数据库中的位置,并将仿真信息键-值对中的“值”嵌入到该地址或者位置。
所述目标数据库存储所有源数据,所述将仿真信息的键-值对分发至目标数据库的过程就是按照仿真信息键-值对中的“键”寻找物理存储器的地址或者结构化数据库中的位置,并将仿真信息键-值对中的“值”嵌入到该地址或者位置。
数据脱敏的设备,其特征在于包括:
源数据存储器,用于存储原始数据;
敏感信息表达式存储库,用于存储敏感信息表达式;
非结构化数据仓库,用于存储敏感信息的键-值对;
目标数据库,用于暂时存放目标数据并最终成为脱敏数据;
脱敏处理器,用于分析和扫描源数据存储器中的源数据信息,抽取源数据中的敏感信息,生成敏感信息的键-值对,处理敏感信息的键-值对生成仿真信息的键-值对,并将仿真信息的键-值对嵌入到目标和脱敏数据库。
由于采用上述技术方案,本发明可以不同结构的数据库之间跨平台、大批量、高仿真的数据脱敏,所有敏感数据不在脱敏服务器内留存,彻底杜绝敏感数据泄露的可能。
附图说明
图1是本发明一个实施例的流程框图。
图2是本发明另一个实施例的流程框图。
具体实施方式
如图1、图2所示,本发明所述数据的脱敏方法包括如下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京网智天元科技股份有限公司,未经北京网智天元科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710000569.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:文件管理系统及其方法
- 下一篇:在分布式文件系统中实现分布式管道的方法和装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置