[发明专利]基于敏感属性值约束的匿名保护方法在审
申请号: | 202210267491.0 | 申请日: | 2022-03-18 |
公开(公告)号: | CN114817977A | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 栾英姿;荣林通 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06K9/62;H04L9/40 |
代理公司: | 西安智大知识产权代理事务所 61215 | 代理人: | 段俊涛 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 敏感 属性 约束 匿名 保护 方法 | ||
1.一种基于敏感属性值约束的匿名保护方法,其特征在于,包括如下步骤:
步骤1,对待发布的网络用户原始数据集D={X1,X2,X3,...,XN}进行聚类,获取m个初始聚类中心点U={μ1,μ2,...,μm},根据语义相似程度划分敏感属性类别,并计算每个敏感属性类别的α约束阈值初始化原始数据集D的簇集合E={C1,C2,...,Cm}为其中N为原始数据集D的数据个数,m为原始数据集D的簇个数;
步骤2,从U依次选取一个聚类中心μi;
如果执行步骤3;
如果执行步骤5;
步骤3,从数据集D中找到离μi最近的数据Xi;
如果μi的敏感属性值和Xi的敏感属性值不同,并且簇Ci中的敏感属性值种类数小于l,则将Xi归入簇Ci中,并从原始数据集D中删除Xi,更新Ci和D得到Ci′和D′:Ci′←Ci∪{Xi},D′←D-{Xi},←表示更新符号;l是约束的同一个簇中敏感属性值的种类个数;
如果μi的敏感属性值和Xi的敏感属性值相同,执行步骤4;
步骤4,如果簇Ci′的敏感属性值种类小于l,且未遍历完D,则执行步骤3;否则,更新U得到U′:U′←U-{μi},执行步骤2;
步骤5,初始化集合
步骤6,从D′剩余数据中选取一个数据Xj,计算Xj到每个簇的距离,找到离Xj最近的簇Cj:
如果Xj满足如下条件a或b,则将Xj归入簇Cj中,并从D′中删除Xj;
如果Xj不满足条件a或b,则继续寻找离Xj最近的下一个簇Ct,判断是否满足条件a或b,直至找到一个满足条件a或b的簇,将数据Xj放入该簇中;如果遍历完所有簇均不满足条件a或b,则将Xj加入集合R中,执行步骤7;
条件a:Cj中的所有敏感属性值均与Xj的敏感属性值不同,且|Cj|<k;
条件b:Cj中的某一敏感属性值与Xj的敏感属性值相同,且|Cj|<k和
其中,k是约束的每个簇中的数据个数,|Cj|表示簇Cj中现有的数据个数;
步骤7,判断D′是否为
如果为执行步骤8;
如果不为执行步骤6;
步骤8,判断集合R中是否含有数据:
如果有,将剩余数据按信息损失最小加入到数据个数小于k的簇中,并将该数据从集合R中删去,继续执行步骤8;如果没有,执行步骤9;
步骤9,判断形成的簇是否满足(k,l,α)约束,调整簇大小;
步骤10,对每个簇中的数据进行局部泛化处理,形成匿名数据集D*。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210267491.0/1.html,转载请声明来源钻瓜专利网。