[发明专利]文件脱敏方法、装置、电子设备及存储介质在审
申请号: | 202210288220.3 | 申请日: | 2022-03-23 |
公开(公告)号: | CN114547696A | 公开(公告)日: | 2022-05-27 |
发明(设计)人: | 姜道凯 | 申请(专利权)人: | 平安证券股份有限公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 广东省深圳市福田区福田*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文件 方法 装置 电子设备 存储 介质 | ||
本发明涉及数据处理领域,揭露一种文件脱敏方法、装置、电子设备以及存储介质,所述方法包括:获取信息系统的历史数据字段,识别历史数据字段中的历史敏感字段,构建历史敏感字段的历史脱敏规则;接收信息系统的当前文件,提取当前文件的当前数据字段,将当前数据字段与历史敏感字段进行匹配;在当前数据字段与历史敏感字段匹配成功时,利用历史脱敏规则对当前数据字段的数据进行脱敏,得到第一脱敏数据;在当前数据字段与历史敏感字段匹配失败时,构建当前数据字段的当前脱敏规则,以执行对当前数据字段进行数据脱敏,得到第二脱敏数据;将第一脱敏数据和第二脱敏数据进行汇总,得到当前文件的脱敏文件。本发明可以提高文件脱敏的效率。
技术领域
本发明涉及数据处理领域,尤其涉及一种文件脱敏方法、装置、电子设备及计算机可读存储介质。
背景技术
在信息系统日常运行中,由于信息系统自身运行、业务需求等原因,会落地存储不同的文件,如代码文件、数据库、日志文件、配置文件、数据文件等,这些文件会记录主机、网络、客户等信息,但在记录的信息中会存在部分数据是比较敏感,不能随意泄露,但是,出于业务或者其它的要求,有些文件必须要外发,比如外购系统需要把日志文件发给软件厂商排查定位问题,部分系统数据要从数据导出给运营部分析等,因此,如何对信息系统产生的文件进行敏感数据脱敏显得的尤为重要。
目前,文件的数据脱敏通常是基于人工进行操作,但是由于在实际业务场景中,由于系统文件的不同特征,通常需要安排不同的人员针对性的对系统文件进行脱敏,这样会耗费较高的人工时间,影响文件脱敏的效率,另外在面对系统文件的存储量过大时,会需要耗费较高的时间成本,从而也会影响文件脱敏的效率。
发明内容
本发明提供一种文件脱敏方法、装置、电子设备及计算机可读存储介质,其主要目的在于提高文件脱敏的效率。
为实现上述目的,本发明提供的一种文件脱敏方法,包括:
获取信息系统的历史数据字段,识别所述历史数据字段中的历史敏感字段,并构建所述历史敏感字段的历史脱敏规则;
接收所述信息系统的当前文件,提取所述当前文件的当前数据字段,将所述当前数据字段与所述历史敏感字段进行匹配;
在所述当前数据字段与所述历史敏感字段匹配成功时,利用所述历史脱敏规则对所述当前数据字段的数据进行脱敏,得到第一脱敏数据;
在所述当前数据字段与所述历史敏感字段匹配失败时,构建所述当前数据字段的当前脱敏规则,以执行对所述当前数据字段进行数据脱敏,得到第二脱敏数据;
将所述第一脱敏数据和所述第二脱敏数据进行汇总,得到所述当前文件的脱敏文件。
可选地,所述识别所述历史数据字段中的历史敏感字段,包括:
获取所述历史数据字段的字段维度,根据所述字段维度,识别所述历史数据字段的字段属性;
判断所述字段属性是否存在于预设的敏感属性表;
若所述字段属性不存在于所述敏感属性表中,则将所述历史数据字段不作为历史敏感字段;
若所述字段属性存在于所述敏感属性表中,则将所述历史数据字段作为历史敏感字段。
可选地,所述构建所述历史敏感字段的历史脱敏规则,包括:
配置所述历史敏感字段的脱敏脚本,在所述脱敏脚本中定义所述历史敏感字段的脱敏策略;
根据所述脱敏策略,生成所述历史敏感字段的历史脱敏规则。
可选地,所述提取所述当前文件的当前数据字段,包括:
对所述当前文件进行数据清洗,得到清洗数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安证券股份有限公司,未经平安证券股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210288220.3/2.html,转载请声明来源钻瓜专利网。