[发明专利]一种基于隐私信息检测的数据隐私性量化评估方法在审
申请号: | 201910391042.5 | 申请日: | 2019-05-11 |
公开(公告)号: | CN110175327A | 公开(公告)日: | 2019-08-27 |
发明(设计)人: | 韩伟力;贾昊阳;盛毅敏;阮雯强;王晓阳 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F21/60 |
代理公司: | 上海正旦专利代理有限公司 31200 | 代理人: | 陆飞;陆尤 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于数据安全技术领域,具体为一种基于隐私信息检测的数据隐私性量化评估方法。本发明包括四个步骤:确定隐私实体所属关系、构造隐私实体集、实体集敏感性及可识别性计算、以及数据集隐私性量化评估。本发明利用数据集中检测到的隐私实体基本信息,通过实体之间的文本距离构建隐私实体集,并根据预先定义的隐私实体敏感性与可识别性分值,计算出整个数据集的隐私性量化结果。本发明的优点在于:方法具有良好的普适性,可应用于不同领域的数据集隐私性量化评估;本方法给出的量化结果可以直观展示数据集隐私泄露的严重程度,对于使用同一评估标准的两个不同数据集,可以通过直接比较其量化结果高低从而比较隐私泄露的严重性。 | ||
搜索关键词: | 量化评估 数据集 隐私 量化结果 隐私性 数据隐私性 可识别性 隐私泄露 隐私信息 检测 数据安全技术 基本信息 评估标准 数据集中 所属关系 文本距离 预先定义 展示数据 普适性 构建 直观 应用 | ||
【主权项】:
1. 一种基于隐私信息检测的数据隐私性量化评估方法,其特征在于,具体步骤如下:步骤一、确定隐私实体所属关系对于已经检测完毕的数据集,确定每一个隐私实体属于哪一个实际个体;在单条数据中,个体以姓名作为唯一标识,依据隐私实体的类别,位置以及长度确定当前隐私实体所属的个体,每个隐私实体仅属于一个个体;步骤二、构造隐私实体集在单条数据中,以个体为单位,姓名为标识符,构建隐私实体集;在每个集合中,对内容重复的隐私实体仅记录一次,对同一类别不同值的隐私实体分别进行记录;步骤三、隐私实体集敏感性及可识别性计算利用预定义好的单个隐私实体敏感性及识别性分值,对单条数据中统计出的每个实体集进行敏感性和识别性的计算,其中敏感性指当前实体集泄露将会造成的风险大小,敏感性越高,风险越大;识别性指当前实体集可以识别出物理个体的难易程度,可识别性越高,识别出个体的难度越小;步骤四、数据集整体隐私性评估对于每一个隐私实体集合,利用上一步计算得到的敏感性和识别性,计算当前集合的隐私性量化值;对所有集合的隐私性进行加和,得到整个数据集的隐私性量化结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910391042.5/,转载请声明来源钻瓜专利网。