[发明专利]基于数字中台的敏感数据管理方法、装置及电子设备在审
| 申请号: | 202210997587.2 | 申请日: | 2022-08-19 |
| 公开(公告)号: | CN115081025A | 公开(公告)日: | 2022-09-20 |
| 发明(设计)人: | 吴景文;张昆;叶祖焕;刘洋;黄睿 | 申请(专利权)人: | 湖南华菱电子商务有限公司 |
| 主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F16/28;G06F16/35;G06K9/62 |
| 代理公司: | 长沙知行亦创知识产权代理事务所(普通合伙) 43240 | 代理人: | 李杰 |
| 地址: | 410000 湖南省长沙市高新开*** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 数字 敏感 数据管理 方法 装置 电子设备 | ||
1.一种基于数字中台的敏感数据管理方法,其特征在于,所述方法包括:
获取预构建的数字中台中的用户信息,基于所述用户信息从所述数字中台中提取业务周期数据集合,其中,所述业务周期数据集合包括结构化数据集合及非结构化数据集合;
计算所述结构化数据集合中各数据属性的敏感度,基于所述敏感度对所述结构化数据集合进行敏感聚类,并对聚类结果进行敏感数据分级,得到结构数据敏感分级结果;
利用预构建的多元业务周期模型提取所述非结构化数据集合中的数据特征,基于平方和梯度下降法对所述数据特征进行梯度聚类,并利用预设的分级标签对梯度聚类结果进行分级标注,得到非结构数据敏感分级结果;
将所述结构数据敏感分级结果及所述非结构数据敏感分级结果存储至所述数字中台;
接收用户实时敏感数据访问行为,利用预构建的异常访问识别模型对所述用户实时敏感数据访问行为进行异常识别,根据异常识别结果从所述数字中台中获取敏感数据。
2.如权利要求1中所述的基于数字中台的敏感数据管理方法,其特征在于,所述计算所述结构化数据集合中各数据属性的敏感度,基于所述敏感度对所述结构化数据集合进行敏感聚类,并对聚类结果进行敏感数据分级,得到结构数据敏感分级结果,包括:
利用预设的熵值敏感度计算公式计算所述结构化数据集合中各数据属性的敏感度;
利用k-means聚类算法对所述敏感度进行敏感聚类,得到所有数据属性的原始聚类结果;
基于Aprior 算法构建所述原始聚类结果中数据属性的关联规则,并基于构建成功的关联规则对所述原始聚类结果重新进行划分,得到标准聚类结果;
计算所述标准聚类结果中数据属性的互信息值,并基于所述互信息值的大小排序对所述结构化数据集合中的敏感数据进行分级,得到所述结构数据敏感分级结果。
3.如权利要求2所述的基于数字中台的敏感数据管理方法,其特征在于,所述原始聚类结果包括敏感聚类簇及疑似敏感聚类簇,以及所述基于Aprior 算法构建所述原始聚类结果中数据属性的关联规则,并基于构建成功的关联规则对所述原始聚类结果重新进行划分,得到标准聚类结果,包括:
基于所述Aprior 算法,建立所述疑似敏感聚类簇中数据属性至所述敏感聚类簇中数据属性的关联规则;
重新对关联规则建立成功的数据属性进行敏感度计算,并根据敏感度大小调整敏感聚类簇及疑似敏感聚类簇中的数据属性,将调整后的敏感属性集及非敏感属性集作为所述标准聚类结果。
4.如权利要求3所述的基于数字中台的敏感数据管理方法,其特征在于,所述重新对关联规则建立成功的数据属性进行敏感度计算,包括:
利用下述公式计算敏感度:
其中,表示成功建立关联规则的第i个数据属性的敏感度,xi表示第i个成功建立关联规则的数据属性,表示第i个成功建立关联规则的数据属性的最大离散熵,表示第i个成功建立关联规则的数据属性的条件变化熵,表示数据属性xi及数据属性xj建立关联规则后的条件熵。
5.如权利要求2所述的基于数字中台的敏感数据管理方法,其特征在于,所述计算所述标准聚类结果中数据属性的互信息值,包括:
通过下述公式计算互信息值:
其中,A,B表示敏感属性集中的两个数据属性,n表示数据属性的属性值个数,ai表示数据属性A中第i个属性值,bi表示数据属性B中第i个属性值,表示ai的先验概率,表示在bi条件时的后验概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南华菱电子商务有限公司,未经湖南华菱电子商务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210997587.2/1.html,转载请声明来源钻瓜专利网。





