[发明专利]一种敏感数据快速扫描方法及装置有效
申请号: | 201711403790.8 | 申请日: | 2017-12-22 |
公开(公告)号: | CN108009430B | 公开(公告)日: | 2020-04-10 |
发明(设计)人: | 王小军;喻波;王志海;秦凯;吴宏毅 | 申请(专利权)人: | 北京明朝万达科技股份有限公司 |
主分类号: | G06F21/57 | 分类号: | G06F21/57;G06F9/38 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100097 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 敏感数据 快速 扫描 方法 装置 | ||
1.一种敏感数据快速扫描方法,其特征在于,该方法包括以下步骤:
获取终端的CPU信息,确定多线程扫描的最大有效线程数;
对待扫描文件进行解析,得到待扫描的内容信息;
根据最大有效线程数和文件大小,确定对待扫描文件内容信息进行分块的分块数量;
根据最大有效线程数和文件分块数量,确定需要创建的线程数量;
根据所述线程数量创建扫描线程,对分块后的文件分块进行扫描,以确定文件包含的敏感数据。
2.根据权利要求1所述的方法,所述CPU为多核CPU,所述最大有效线程数等于所述CPU的内核数量。
3.根据权利要求1所述的方法,在对文件分块进行扫描之前,需要加载扫描的相关配置信息,包括敏感信息关键字、匹配规则信息、文件敏感度信息。
4.根据权利要求1所述的方法,所述文件分块的数量不大于所述最大有效线程数。
5.根据权利要求1所述的方法,所述对待扫描文件进行解析,得到待扫描的内容信息包括:
对不同类型的文件进行解析,得到待扫描的内容信息;
对解析得到的文件内容信息进行编码转换,以得到指定编码的内容信息。
6.根据权利要求1-5之一所述的方法,所述文件分块的数量大于1,各文件分块之间存在交集。
7.一种敏感数据快速扫描装置,其特征在于,该装置包括:
最大有效线程确定模块,获取终端的CPU信息,确定多线程扫描的最大有效线程数;
文件内容解析模块,对待扫描文件进行解析,得到待扫描的内容信息;
文件分块数量确定模块,根据最大有效线程数和文件大小,确定对待扫描文件内容信息进行分块的分块数量;
线程数量确定模块,根据最大有效线程数和文件分块数量,确定需要创建的线程数量;
文件分块扫描模块,根据所述线程数量创建扫描线程,对分块后的文件分块进行扫描,以确定文件包含的敏感数据。
8.根据权利要求7所述的装置,所述CPU为多核CPU,所述最大有效线程数等于所述CPU的内核数量。
9.根据权利要求7所述的装置,该装置还包括:配置信息加载模块,在对文件分块进行扫描之前,需要加载扫描的相关配置信息,包括敏感信息关键字、匹配规则信息、文件敏感度信息。
10.根据权利要求7所述的装置,所述文件分块的数量不大于所述最大有效线程数。
11.根据权利要求7所述的装置,所述文件内容解析模块,对待扫描文件进行解析,得到待扫描的内容信息包括:
对不同类型的文件进行解析,得到待扫描的内容信息;
对解析得到的文件内容信息进行编码转换,以得到指定编码的内容信息。
12.根据权利要求7-11之一所述的装置,所述文件分块的数量大于1,各文件分块之间存在交集。
13.一种计算机可读存储介质,该介质存储有计算机程序指令,其特征在于,当执行所述计算机程序指令时,实现如权利要求1-6之一所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明朝万达科技股份有限公司,未经北京明朝万达科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711403790.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种建筑工地用高亮度照明控制器
- 下一篇:一种延长广玉兰花期的处理方法