[发明专利]基于敏感属性值约束的匿名保护方法在审

专利信息
申请号: 202210267491.0 申请日: 2022-03-18
公开(公告)号: CN114817977A 公开(公告)日: 2022-07-29
发明(设计)人: 栾英姿;荣林通 申请(专利权)人: 西安电子科技大学
主分类号: G06F21/62 分类号: G06F21/62;G06K9/62;H04L9/40
代理公司: 西安智大知识产权代理事务所 61215 代理人: 段俊涛
地址: 710071*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 敏感 属性 约束 匿名 保护 方法
【权利要求书】:

1.一种基于敏感属性值约束的匿名保护方法,其特征在于,包括如下步骤:

步骤1,对待发布的网络用户原始数据集D={X1,X2,X3,...,XN}进行聚类,获取m个初始聚类中心点U={μ1,μ2,...,μm},根据语义相似程度划分敏感属性类别,并计算每个敏感属性类别的α约束阈值初始化原始数据集D的簇集合E={C1,C2,...,Cm}为其中N为原始数据集D的数据个数,m为原始数据集D的簇个数;

步骤2,从U依次选取一个聚类中心μi

如果执行步骤3;

如果执行步骤5;

步骤3,从数据集D中找到离μi最近的数据Xi

如果μi的敏感属性值和Xi的敏感属性值不同,并且簇Ci中的敏感属性值种类数小于l,则将Xi归入簇Ci中,并从原始数据集D中删除Xi,更新Ci和D得到Ci′和D′:Ci′←Ci∪{Xi},D′←D-{Xi},←表示更新符号;l是约束的同一个簇中敏感属性值的种类个数;

如果μi的敏感属性值和Xi的敏感属性值相同,执行步骤4;

步骤4,如果簇Ci′的敏感属性值种类小于l,且未遍历完D,则执行步骤3;否则,更新U得到U′:U′←U-{μi},执行步骤2;

步骤5,初始化集合

步骤6,从D′剩余数据中选取一个数据Xj,计算Xj到每个簇的距离,找到离Xj最近的簇Cj

如果Xj满足如下条件a或b,则将Xj归入簇Cj中,并从D′中删除Xj

如果Xj不满足条件a或b,则继续寻找离Xj最近的下一个簇Ct,判断是否满足条件a或b,直至找到一个满足条件a或b的簇,将数据Xj放入该簇中;如果遍历完所有簇均不满足条件a或b,则将Xj加入集合R中,执行步骤7;

条件a:Cj中的所有敏感属性值均与Xj的敏感属性值不同,且|Cj|<k;

条件b:Cj中的某一敏感属性值与Xj的敏感属性值相同,且|Cj|<k和

其中,k是约束的每个簇中的数据个数,|Cj|表示簇Cj中现有的数据个数;

步骤7,判断D′是否为

如果为执行步骤8;

如果不为执行步骤6;

步骤8,判断集合R中是否含有数据:

如果有,将剩余数据按信息损失最小加入到数据个数小于k的簇中,并将该数据从集合R中删去,继续执行步骤8;如果没有,执行步骤9;

步骤9,判断形成的簇是否满足(k,l,α)约束,调整簇大小;

步骤10,对每个簇中的数据进行局部泛化处理,形成匿名数据集D*

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210267491.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top