[发明专利]一种数据安全级别的识别检测方法及装置有效

专利信息
申请号: 201711473686.6 申请日: 2017-12-29
公开(公告)号: CN108363717B 公开(公告)日: 2021-03-12
发明(设计)人: 赵伟;武新;崔维力;刘奥 申请(专利权)人: 天津南大通用数据技术股份有限公司
主分类号: G06F16/28 分类号: G06F16/28;G06N3/04
代理公司: 天津滨海科纬知识产权代理有限公司 12211 代理人: 李成运
地址: 300384 天津市滨海新区华*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 数据 安全级别 识别 检测 方法 装置
【说明书】:

一种数据安全级别的识别检测方法及装置,本发明旨在提供一种识别检测数据安全分级的方法。该方法作用的对象为关系型数据库或大数据服务提供者的存储数据,可为单个关系表,单个存储文件或单个数据库判定其安全级别,级别越高则数据泄漏或损坏后造成的损失越大。该方法以数据单元所含敏感数据多少作为最重要特征,结合数据单元的主题,数据量,对大数据服务平台上尽可能多的数据单元做聚类并根据其结果设定安全分级并可对新的数据单元进行安全级别认定。该种分级方法能全面,准确,有效的评估数据安全级别,为普通数据服务和大数据服务平台应该设定哪种级别的数据安全保护提供参考,为评估大数据服务能力提供支持。

技术领域

本发明属于数据挖掘领域,涉及到通过大数据应用大数据分析算法对数据安全级别进行检测评估,具体涉及到了数据的表示,特征提取和聚类算法创新及应用。

背景技术

数据往往以一定形式存储在数据库中,方便用户存取和操作。现如今,大数据依托于更广泛更开放的云平台出现,一方面改变着人们的生活方式和对数据的认知,另一方面也对敏感的私有数据的安全保护提出了更高的要求。人们希望数据服务提供者能够安全存储敏感数据并提供可靠地数据服务,尤其是在大数据环境下,因为敏感数据的恶意篡改、泄露、遗失、损坏等会造成非常严重的后果。对于数据服务的提供者,根据数据重要程度提供相应级别的安全保护至关重要,数据安全级别越高,说明数据一旦泄露造成的后果越严重,其所需要的安全保护级别就越高。而现在并没有评估数据安全级别的体系或方法,本发明提供了一种识别检测数据安全分级的方法。

数据大都以数据表的形式存储自数据库中,待评估的数据单元可能是数据表,也可能是一个数据库。评估一个数据单元的安全级别,需要将安全相关的因素提取出来。而这些因素太多,哪些最重要,哪些可以起到一定作用但不那么重要,这些因素对安全级别的影响程度是怎样的,如何将这些因素融合起来综合评估一个数据单元的安全级别,这些问题都是较难解决的。直观认为,数据单元含有的敏感数据越多,其安全级别就会越高。但另外如数据单元主题,数据量多少这些因素,也起到了比较重要的作用。比如某一数据单元敏感数据并不多,但它的主题与国家安全相关,那么它的安全级别依然很高。

数据单元的主题是影响其安全级别的重要因素,而对数据单元主题的划分现在没有可靠地标准,无法将其简单的划分为几类,而且使用人工标准的划分只能依靠人工来识别新数据单元的主题,无法自动化。因此确定一个数据单元的主题依然困难。现如今有很多的自然语言处理方法,能够使用聚类、深度学习等方法确定文本主题等,但对数据库中存储的格式化的数据进行主题分类识别的研究较少,其难度在于如何表示数据单元主题相关特征。比如一张数据表,除了要关注数据表中的各属性的值,还要关注该表有哪些属性。

普通的将影响数据单元安全级别的各因素简单融合叠加,人为设定安全分级的方法太主观,不科学,无法对数据单元进行有效分级,分级结果也不具备说服性。因此要找到科学有效的分级方法。聚类能够在没有标记的情况下将数据自行聚集成多个簇,其恰好能够对应于安全分级,因此聚类对于解决数据安全级别的问题是一个有效手段。采用大量样本,最好是云平台上的全部数据,才能获得更准确科学的安全级别。而大数据量会使聚类过程消耗大量时间和计算间,因此要求聚类方法尽可能简单高效。另一个难题是分类数量的确定。由于数据安全级别需要自动形成最合适的类别,所以常用的k-means聚类算法不能奏效。采用层次聚类方法,通过计算各层聚类后增益熵的方法,能够选取最佳分类,从而确定安全级别个数。

发明内容

本发明的目标是在现有聚类算法基础上,针对大数据服务提供者所存储的大量数据,提出一种能够识别检测数据安全级别的方法,为普通数据服务和大数据服务平台应该设定哪种级别的数据安全保护提供参考,为评估大数据服务能力提供支持。

为了达到上述目的,本发明采取的技术方案为:一种数据安全级别的识别检测方法,包括:

步骤1、构建敏感数据字典;

步骤2、为每个数据单元构建主题相关特征向量,并对大数据平台的数据单元进行聚类,得到主题分类;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津南大通用数据技术股份有限公司,未经天津南大通用数据技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711473686.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top