[发明专利]数据脱敏方法及装置在审
申请号: | 202110862700.1 | 申请日: | 2021-07-29 |
公开(公告)号: | CN113569289A | 公开(公告)日: | 2021-10-29 |
发明(设计)人: | 王静文;毕萍 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F16/22 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 刘熔;赵平 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 方法 装置 | ||
本申请实施例提供一种数据脱敏方法及装置,可用于大数据技术领域,方法包括:根据非可读的目标主机生产数据文件的表结构信息,获取目标主机生产数据文件中的各个敏感字段类型与预设的脱敏程序之间的对应关系;应用预设的脱敏工具对目标主机生产数据文件进行数据抽取,并在数据抽取的过程中,基于各个敏感字段类型各自对应的脱敏程序对自目标主机生产数据文件中抽取的敏感数据进行脱敏处理,以生成目标主机生产数据文件对应的脱敏主机生产数据文件。本申请能够在对主机生产数据文件进行数据抽取的同时进行数据脱敏,能够有效提高数据脱敏的安全性,有效防止隐私数据泄露,能够有效提高数据脱敏的效率及可靠性,并降低脱敏过程中的资源占用。
技术领域
本申请涉及数据处理技术领域,特别涉及大数据技术领域,具体涉及数据脱敏方法及装置。
背景技术
随着信息时代的发展,人们对数据信息的安全要求越来越重视,尤其是银行等金融机构,存在大量的需要进行脱敏的数据;比如对非生产环境下的敏感数据的脱敏保护。一般用于开发、测试等,如果不能有效实施数据保护,极易造成敏感数据的泄露。一般需要对身份证号、手机号、卡号、客户信息等信息进行脱敏变形。
但是,如银行等金融机构在进行数据脱敏的过程中,由于会产生具备可读性的中间文件,因此依然存在隐私泄露的风险;且由于数据脱敏后得到的数据结果与脱敏前的主机生产数据的生产数据分布特征不同,因此会使得数据脱敏后失去原来生产上的分布特征;以及,现有的数据脱敏方式还需要建立脱敏环境,还需要占用大量主机包括CPU、内存、存储等,因此会大大降低数据脱敏的效率并占用大量资源。
发明内容
针对现有技术中的问题,本申请提供一种数据脱敏方法及装置,能够在不产生中间文件的基础上,在对主机生产数据文件进行数据抽取的同时进行数据脱敏,能够有效提高数据脱敏的安全性,有效防止隐私数据泄露,能够有效提高数据脱敏的效率及可靠性,并降低脱敏过程中的资源占用。
为解决上述技术问题,本申请提供以下技术方案:
第一方面,本申请提供一种数据脱敏方法,包括:
根据非可读的目标主机生产数据文件的表结构信息,获取所述目标主机生产数据文件中的各个敏感字段类型与预设的脱敏程序之间的对应关系;
应用预设的脱敏工具对所述目标主机生产数据文件进行数据抽取,并在数据抽取的过程中,基于各个所述敏感字段类型各自对应的脱敏程序对自所述目标主机生产数据文件中抽取的敏感数据进行脱敏处理,以生成所述目标主机生产数据文件对应的脱敏主机生产数据文件。
进一步地,在所述根据非可读的目标主机生产数据文件的表结构信息,获取所述目标主机生产数据文件中的各个敏感字段类型与预设的脱敏程序之间的对应关系之前,还包括:
接收主机数据库数据表的磁带库备份文件,并将该磁带库备份文件确定为当前非可读的目标主机生产数据文件;
调取预存储的所述目标主机生产数据文件的表结构信息,其中,所述表结构信息包括所述目标主机生产数据文件中的各个数据表的表字段类型和对应的字段长度。
进一步地,在所述根据非可读的目标主机生产数据文件的表结构信息,获取所述目标主机生产数据文件中的各个敏感字段类型与预设的脱敏程序之间的对应关系之前,包括:
接收脱敏配置表,其中,该脱敏配置表用于存储预设的各个脱敏算法与各个敏感字段类型之间的对应关系;
生成各个所述脱敏算法各自对应的脱敏程序,并将各个所述脱敏程序与各个所述脱敏算法之间的对应关系也存入所述脱敏配置表中。
进一步地,所述根据非可读的目标主机生产数据文件的表结构信息,获取所述目标主机生产数据文件中的各个敏感字段类型与预设的脱敏程序之间的对应关系,包括:
在所述目标主机生产数据文件的表结构信息中的各个表字段类型中选取全部的敏感字段类型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110862700.1/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置