[发明专利]一种基于分形维数的流式数据差分隐私保护发布方法有效
申请号: | 201810507144.4 | 申请日: | 2018-05-24 |
公开(公告)号: | CN108763956B | 公开(公告)日: | 2020-09-15 |
发明(设计)人: | 张兴;颜飞;史伟;李万杰;李帅 | 申请(专利权)人: | 辽宁工业大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06K9/62 |
代理公司: | 北京远大卓悦知识产权代理事务所(普通合伙) 11369 | 代理人: | 李烨 |
地址: | 121001 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 分形维数 数据 隐私 保护 发布 方法 | ||
本发明公开了一种基于分形维数的流式数据差分隐私保护发布方法,包括:步骤一、利用滑动窗口技术对数据流进行分割,将满足条件的数据流以静态方式展示在滑动窗口中;步骤二、将数据进行初始聚类,并且将初始聚类结果计算各类的分形维数,并构造分形树;步骤三、将步骤一种分割窗口数据送至分形聚类模块用于数据聚类分析,对所到达数据进行分形聚类,对分形聚类结果进行按类统计,形成待发布分组,并且计算分组间差值集,并且以相似分组求均值进行代替,对分组融合优化后分组进行噪声干扰,并发布噪声干扰后的分组数据;步骤四、当分组数据量达到滑动窗口大小时,窗口向前平移,并且重复步骤三完成最终的数据发布。
技术领域
本发明涉及大数据安全领域,具体涉及一种基于分形维数的流式数据差分隐私保护发布方法。
背景技术
实时动态数据存在于多种应用领域之中,例如监测传感器网络数据、在线交易数据处理、疾病实时统计发布、推荐系统等。这些应用场合通常需要快速而又准确地数据流统计发布,然而动态数据的直接发布必然会导致个人隐私信息泄露的发生。因此,在动态数据的处理和发布过程中,需要保护动态数据中的隐私信息,并保证数据的可用性。
现有差分隐私数据发布方法的研究大多关注静态数据集的发布问题。然而,研究表明,当前社会对数据的动态发布需求更为强烈。而且,静态数据的差分隐私发布方法无法应用于动态数据的发布。由于动态数据具有动态性、多维性、持续到达和多种数据类型等特点,从而导致基于差分隐私的动态数据的发布存在发布数据可用性低、噪声积累导致数据发布误差大和隐私预算耗尽等问题,而且针对多维动态数据的差分隐私发布研究较少。而且研究发现,环境检测数据、传感器网络产生的数据等动态数据流具有分形特性。因此,利用分形挖掘技术对此类数据进行处理,并结合差分隐私技术对动态数据进行隐私保护数据发布,能够较好的满足动态数据的隐私保护发布需求和保证数据的可用性。
发明内容
本发明设计开发了一种基于分形维数的流式数据差分隐私保护发布方法,本发明的发明目的是能够较好的满足动态数据的隐私保护发布需求。
本发明提供的技术方案为:
一种基于分形维数的流式数据差分隐私保护发布方法,包括如下步骤:
步骤一、利用滑动窗口技术对数据流进行分割,将满足条件的数据流以静态方式展示在所述滑动窗口中;
步骤二、将数据进行初始聚类,并且将初始聚类结果计算各类的分形维数,并构造分形树;
步骤三、将所述步骤一种分割窗口数据送至分形聚类模块用于数据聚类分析,有分形维数计算,对所到达数据进行分形聚类,对分形聚类结果进行按类统计,形成待发布分组,并且计算分组间差值集作为近似分组融合时近似分组判断参考,并且以相似分组求均值进行代替,对分组融合优化后分组进行噪声干扰,并发布噪声干扰后的分组数据;
步骤四、当所述分组数据量达到所述滑动窗口大小时,窗口向前平移,并且重复步骤三完成最终的数据发布。
优选的是,在所述步骤一中,对数据流进行分割包括:将长度为T的数据流xi分割成T个时间戳上的数据点,得到数据点D={x1,x2,…xT}。
优选的是,在所述步骤二中,所述初始聚类和构造分形树的过程包括:
积累一段时间的数据流,利用现有聚类算法进行初始聚类;若初始聚类为k个,记为{C1,C2,…,Ck},分别对初始化的类计算其分形维数,并构建分形树{FTree1,FTree2,…,FTreek},第i个类的分形维数记为Fd(Ci)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辽宁工业大学,未经辽宁工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810507144.4/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置