[发明专利]基于大数据的数据安全处理方法、装置、设备及存储介质在审
申请号: | 202210583124.1 | 申请日: | 2022-05-25 |
公开(公告)号: | CN114996731A | 公开(公告)日: | 2022-09-02 |
发明(设计)人: | 白云 | 申请(专利权)人: | 深圳云创数安科技有限公司 |
主分类号: | G06F21/60 | 分类号: | G06F21/60;G06F21/62;G06F21/64;G06K9/62 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;郭梦霞 |
地址: | 518101 广东省深圳市南山街道梦海*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 数据 安全 处理 方法 装置 设备 存储 介质 | ||
1.一种基于大数据的数据安全处理方法,其特征在于,所述方法包括:
当接收到业务发送的数据请求时,获取请求数据,对所述请求数据进行量化处理,得到数据向量集;
提取所述数据向量集中的数据所有权信息向量集,根据所述数据所有权信息向量集,基于预构建的第一随机森林分类模型对所述数据向量集进行第一次分类,得到所述请求数据的第一类别及第一数据分类集;
提取所述第一数据分类集中的业务类型向量集及敏感程度向量集,根据所述业务类型向量集及所述敏感程度向量集,基于预构建的第二随机森林分类模型对所述第一数据分类集进行分类,得到所述请求数据的第二类别及第二数据分类集;
提取所述第二数据分类集中的静态数据集向量及动态数据向量集,根据所述静态数据向量集及所述动态数据向量集,基于预构建的第三随机森林分类模型对所述第二数据分类集进行分类,得到所述请求数据的第三类别及第三数据分类集;
利用UDF函数集成加密及拦截算法,得到集成加密机;
提取所述第三数据分类集中的关键字,从预设缓存中获取预设规则库,基于所述规则库,根据所述关键字、所述第一类别、所述第二类别及所述第三类别,从所述集成加密机中选择对应的算法对所述第三数据分类集中的数据进行数据安全处理,得到安全数据,并将所述安全数据返回给对应的业务端。
2.如权利要求1所述的基于大数据的数据安全处理方法,其特征在于,所述基于预构建的第一随机森林分类模型对所述数据向量集进行第一次分类,得到所述请求数据的第一类别及第一数据分类集,包括:
获取所述第一随机森林分类模型中的多个决策树及每个决策树中至少一层节点的决策维度索引和决策条件;
根据所述第一随机森林分类模型中第一节点的决策维度索引,对所述数据所有权信息向量集进行特征提取,得到所述数据所有权信息向量集在所述第一节点的分裂维度上的特征值;
根据所述第一节点的决策条件对所述特征值进行判断,根据判断结果从所述第一节点的分支节点中确定遍历的第二节点;
根据当前决策维度索引和决策条件,继续提取所述数据所有权信息向量集在所述第二节点的特征值并确定待遍历的下一节点,直至所述决策树遍历完成,得到所述数据向量集的第一类别,根据所述第一类别将所述数据向量集分为第一数据分类集。
3.如权利要求1所述的基于大数据的数据安全处理方法,其特征在于,所述利用UDF函数集成加密及拦截算法,得到集成加密机,包括:
创建通用加密算法及拦截算法的工具类集;
利用UDF函数将所述工具类集封装为集成加密机。
4.如权利要求1所述的基于大数据的数据安全处理方法,其特征在于,所述基于所述规则库,根据所述关键字、所述第一类别、所述第二类别及所述第三类别,从所述集成加密机中选择对应的算法对所述第三数据分类集中的数据进行数据安全处理,得到安全数据,包括:
基于所述规则库,根据所述第一类别、所述第二类别、所述第三类别选择对应的数据安全处理策略;
根据所述数据安全处理策略及所述关键字,利用预设的正则表达式选择对应的数据安全处理方法,其中所述数据安全处理方法包括:加解密、脱敏、拦截及数字签名;
根据所述数据安全处理方法从所述集成加密机中选择对应的算法,对所述第三数据分类集中的数据进行数据安全处理,得到安全数据。
5.如权利要求1所述的基于大数据的数据安全处理方法,其特征在于,所述从预设缓存中获取预设规则库之前,所述方法还包括:
周期性地从预设数据治理平台中获取的预设规则库,并将所述预设规则库更新到预设缓存。
6.如权利要求1所述的基于大数据的数据安全处理方法,其特征在于,所述对所述请求数据进行量化处理,得到数据向量集,包括:
将所述请求数据进行分词处理,得到词语集合;
利用预构建的量化工具将所述词语集合进行量化,得到词向量集合;
根据预设的位置编码,对所述词向量集合进行顺序标注,得到顺序词向量集合;
根据预设的格式化规则,对所述顺序词向量集合进行拆分,并将拆分结果进行排列,得到矩阵向量的数据向量集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳云创数安科技有限公司,未经深圳云创数安科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210583124.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:跨业务门户系统管理方法
- 下一篇:页面认证方法、装置、存储介质及电子设备
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置