[发明专利]敏感数据识别方法、装置、计算机设备及存储介质在审
| 申请号: | 202310381830.2 | 申请日: | 2023-04-11 |
| 公开(公告)号: | CN116629253A | 公开(公告)日: | 2023-08-22 |
| 发明(设计)人: | 柳遵梁;李志刚;周杰;闻建霞;胡宝华;韩雯霞;干忠光 | 申请(专利权)人: | 杭州美创科技股份有限公司 |
| 主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F18/241 |
| 代理公司: | 杭州知学知识产权代理事务所(普通合伙) 33356 | 代理人: | 张雯 |
| 地址: | 311121 浙江省杭州市余杭区*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 敏感数据 识别 方法 装置 计算机 设备 存储 介质 | ||
1.敏感数据识别方法,其特征在于,包括:
获取企业的资产集合的数据内容;
对所述数据内容进行结构化调整,以得到结构化数据集合;
初始化识别引擎;
利用所述识别引擎对所述结构化数据集合进行敏感信息的识别,以得到识别结果;
对所述识别结果进行数据资产敏感类型划分,以得到划分结果;
根据所述划分结果生成可视化报告。
2.根据权利要求1所述的敏感数据识别方法,其特征在于,所述获取企业数据内容,包括:
从企业数据资产中获取数据源信息;
从所述数据源信息中抽取资产集合的数据内容。
3.根据权利要求2所述的敏感数据识别方法,其特征在于,所述数据源信息包括企业数据库类型、数据库和服务器资源的连接信息。
4.根据权利要求1所述的敏感数据识别方法,其特征在于,所述对所述数据内容进行结构化调整,以得到结构化数据集合,包括:
对所述数据内容进行行列转换,形成列值-样本值的结构化数据集合;
将所述结构化数据集合保存在应用内存中。
5.根据权利要求1所述的敏感数据识别方法,其特征在于,所述初始化识别引擎,包括:
读取多个行业的NLP词向量集合文件;
调用识别引擎初始化插件完成NLP词向量集合文件加载,并进行NLP词向量集合的构建;
对完成构建的NLP词向量集合按行业分类。
6.根据权利要求1所述的敏感数据识别方法,其特征在于,所述利用所述识别引擎对所述结构化数据集合进行敏感信息的识别,以得到识别结果,包括:
选择所述结构化数据集合的资产所属行业,并获取对应的NLP词向量集合;
调用识别引擎的识别插件,导入所述结构化数据集合,使用对应的NLP词向量集合进行识别,以得到单个数据内容的识别结果。
7.根据权利要求1所述的敏感数据识别方法,其特征在于,所述对所述识别结果进行数据资产敏感类型划分,以得到划分结果,包括:
初始化内置的敏感类型适配器;
根据所述敏感类型适配器对所述识别结果进行类型转换,以得到转换结果;
根据所述转换结果生成敏感信息集合,以得到划分结果。
8.敏感数据识别装置,其特征在于,包括:
内容获取单元,用于获取企业的资产集合的数据内容;
调整单元,用于对所述数据内容进行结构化调整,以得到结构化数据集合;
引擎初始化单元,用于初始化识别引擎;
识别单元,用于利用所述识别引擎对所述结构化数据集合进行敏感信息的识别,以得到识别结果;
划分单元,用于对所述识别结果进行数据资产敏感类型划分,以得到划分结果;
生成单元,用于根据所述划分结果生成可视化报告。
9.一种计算机设备,其特征在于,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的方法。
10.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时可实现如权利要求1至7中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州美创科技股份有限公司,未经杭州美创科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310381830.2/1.html,转载请声明来源钻瓜专利网。





