[发明专利]面向社区检测应用的社会网络数据发布隐私保护方法有效
申请号: | 201510277513.1 | 申请日: | 2015-05-27 |
公开(公告)号: | CN104866781B | 公开(公告)日: | 2017-07-04 |
发明(设计)人: | 李先贤;王焕杰;刘鹏;王利娥 | 申请(专利权)人: | 广西师范大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 桂林市持衡专利商标事务所有限公司45107 | 代理人: | 陈跃琳 |
地址: | 541004 广*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 社区 检测 应用 社会 网络 数据 发布 隐私 保护 方法 | ||
技术领域
本发明涉及网络数据安全技术领域,具体涉及一种面向社区检测应用的社会网络数据发布隐私保护方法。
背景技术
随着社会网络应用的发展,例如Facebook、MySpace等,通过社交网站进行交友、联系的用户越来越多。这也吸引了更多的数据研究人员和应用开发人员的注意力。通过对社会网络分析可以为数据挖掘与模式分析提供更丰富、更准确的数据来源。但是,发布社会网络数据将会导致用户的敏感信息泄露,这在某种程度上将对用户造成危害。由于社会网络数据中的敏感信息多样化,如节点被识别,节点属性泄露,节点间的关系被识别等,则泄露的方式也有多种,相对应的匿名防护措施也有多种。而保护社会网络数据的隐私需要基于网络数据的特点来研究所对应的保护技术。最常用且直观的一种匿名方法为简单匿名,即移除能唯一标识用户(即图中的节点)的显式标识符属性,如姓名、生日。然而,许多先前的研究已经证实简单匿名不足以保护用户隐私。
为了更好的保护社会网络中的数据隐私,现有的社会网络数据匿名方法有:节点K-匿名,即依据结构相似或者距离相近,将社会网络中的所有节点聚类形成超级节点,使得每个超级节点至少包含K个原始网络图节点。同时,超级节点相连的边概化为超级边。由于,每个超级节点内部的节点相互之间不可区分,所以,此匿名网络节点被识别的概率小于等于1/K;子图K匿名,即假设攻击者知道目标节点所在的特定子图信息,匿名后使社会网络中至少有K-1个子图与之不可区分。除此之外也有K-度匿名、随机化、差分隐私等方法来保护用户信息不被泄露。但在当前的社会网络隐私保护研究中,更多地强调特定场景所对应的匿名模型的隐私保护方法,较少指定发布数据的用途,这样在匿名的过程中,修改边和节点就会在某种程度上破坏原始的某种结构属性。而在现实生活中,用于发布的社会网络数据常被用在各种特定用途中,如:数据连接挖掘,社区中心发现等,这就需要改进原始的匿名方法。
发明内容
本发明所要解决的现有社会网络隐私保护方法会在某种程度上破坏原始网络的某种结构属性的不足,提供一种面向社区检测应用的社会网络数据发布隐私保护方法,其在发布数据时,保证匿名要求的同时,更好的保存了原始图的社区结构这一结构信息,有利于数据分析者做社区的相关分析。
为解决上述问题,本发明是通过以下技术方案实现的:
面向社区检测应用的社会网络数据发布隐私保护方法,包括如下步骤:
步骤1、先初始化数据;再对初始化后的数据进行初步的社区检测,得到匿名前的初始的社区划分;后将数据的节点集合按度数进行排列,得到新的节点序列;
步骤2、K匿名形成超级节点;即
步骤2.1、选择当前节点序列中度数最大的节点,作为当前超级节点的种子节点,并在节点集合中除去已选中的节点;
步骤2.2、计算这个超级节点和节点集合中的每个节点的距离,选择最近的节点合并为超级节点,并在节点集合中除去已选中的节点;
步骤2.3、继续重复上述步骤2.2,即计算距离、合并节点和更新节点集合的过程,直到当前超级节点包含的节点个数达到设定的隐私水平K,则开始下一个超级节点的处理;
步骤2.4、重复上述步骤2.1-2.3,直到节点集合中剩下的节点个数小于设定的隐私水平K;
步骤2.5,分别计算节点集合所剩下的节点和之前已形成的几个超级节点的距离,并逐个将剩下的节点分别合并到距离最小的超级节点中,直到节点集合为空,即节点集合的所有节点均聚类成超级节点;
步骤3、将数据的边概化为带权重的超级边,其中权重即为原始图中连接两个超级节点之间的边的数目;
步骤4、将超级节点和超级边进行拆分;
步骤5、发布匿名后的社会网络数据。
步骤1中,初始化数据即是去掉显示的标识属性,改用重新编号的标识符表示。
步骤1中,采用GN算法来做社区检测。
步骤1中将数据的节点集合按度数降序排列,得到新的节点序列;此时,步骤2中选择当前节点序列中度数最大的节点即排在首位的节点,作为当前超级节点的种子节点。
步骤2.2中,当有多个节点与当前的超级节点的距离最小且相同时,则优先选择与当前超级节点的种子节点为同一个社区的候选节点合并为超级节点;如果候选节点中没有与当前超级节点的种子节点为同一个社区的节点时,则优先选择单节点社区节点合并为超级节点。
步骤2.3和2.4中,设定的隐私水平K的取值范围为1<K≤n,其中n是原始网络图中节点总个数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西师范大学,未经广西师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510277513.1/2.html,转载请声明来源钻瓜专利网。