[发明专利]一种面向实时数据的本地化差分隐私数据流发布方法有效
申请号: | 202210352928.0 | 申请日: | 2022-04-06 |
公开(公告)号: | CN114662152B | 公开(公告)日: | 2023-05-12 |
发明(设计)人: | 陶陶;张福南 | 申请(专利权)人: | 安徽工业大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 安徽知问律师事务所 34134 | 代理人: | 平静 |
地址: | 243002 *** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 实时 数据 本地化 隐私 数据流 发布 方法 | ||
本发明公开了一种面向实时数据的本地化差分隐私数据流发布方法,属于数据隐私保护技术领域。本发明将本地化差分隐私与滑动窗口模型进行结合,采用相似性度量方法计算相邻时刻滑动窗口数据之间的相似度,将随机扰动加入到相似度结果中;当相似度结果为正时,采用贪心聚类算法做减小误差并加噪处理;后采用一种合理的PBA隐私预算分配策略,避免过度的隐私预算消耗,最后发布满足加噪的直方图。本发明不仅能抵御不可信第三方的攻击,还能有效降低直方图发布的误差,从而使本地化差分隐私技术理论在实际应用中有更广阔的前景。
技术领域
本发明属于数据隐私保护技术领域,更具体地说,涉及一种面向实时数据的本地化差分隐私数据流发布方法。
背景技术
在信息迅速发展的大数据时代,隐私保护变得尤为重要。例如,互联网搜索引擎上收集的大量用户的访问记录:用户的购买记录以及用户的评论,能够对当前的流行趋势获得针对性分析;在智慧政府建设中,实行部门数据共享,有利于部门间协作办公等等。这些数据集中包含了个人敏感信息,那么如何在保证个人隐私不被泄露的前提下进行数据的统计分析是当今数据隐私保护研究的热点。本地化差分隐私较中心化差分隐私而言提供更强有力的保证,由于其不仅可以抵御拥有任何背景知识的攻击,还可防止来自不可信第三方的隐私攻击。目前苹果、阿里巴巴等公司已使用LDP模型用于收集用户在默认浏览器主页和搜索引擎设置的一些相关信息。
目前在数据隐私保护领域已有多种算法用于静态数据,而实时数据流的应用场景却较为广泛,但面临实时数据流的应用场景的直方图发布方法却很少,因此针对研究实时数据的隐私保护方法显得尤为需要。
经检索,中国专利申请号为:2019107977157,申请日为:2019年8月27日,发明名称为:一种基于本地化差分隐私的多维众包数据真值发现方法。该申请案以期能够解决具有任何背景知识的敌手去泄露用户敏感数据及无法从嘈杂的数据集中获取准确性回答的问题,同时让任何第三方能够在不知道用户敏感信息的情况下去估计原始数据分布,从而达到能够确保用户数据的隐私性的同时,能够有效的获得每一个众包项目中的准确结果的目的。该方法虽然同样采用了本地化差分隐私思想,但是只是针对众包数据,而且是静态数据统计分析,目前为止实时数据流的应用场景较为广泛,而针对实时数据的隐私保护方法研究较少。
又如,中国专利申请号为:2018105071444,申请日为:2018年5月24日,发明名称为:一种基于分形维数的流式数据差分隐私保护发布方法。该申请案利用滑动窗口技术对数据流进行分割,将满足条件的数据流以静态方式展示在所述滑动窗口中;随后将数据进行初始聚类,并且将初始聚类结果计算各类的分形维数,并构造分形树;将所述步骤一中分割窗口数据送至分形聚类模块用于数据聚类分析,有分形维数计算,对所到达数据进行分形聚类,对分形聚类结果进行按类统计,形成待发布分组,并且计算分组间差值集作为近似分组融合时近似分组判断参考,并且以相似分组求均值进行代替,对分组融合优化后分组进行噪声干扰,并发布噪声干扰后的分组数据;当所述分组数据量达到所述滑动窗口大小时,窗口向前平移,并且重复上述步骤完成最终的数据发布。该方法采用的差分隐私与滑动窗口的结合,采用中心化差分隐私的思想进行数据隐私保护有一个前提假设:依赖于可信的第三方。这在实际应用中是不成立的,在一定程度上限制了传统差分隐私的应用。
基于以上分析,现有技术需要一种既满足实时数据的统计发布又不依赖于可信第三方的数据发布方法。
发明内容
1.发明要解决的技术问题
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽工业大学,未经安徽工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210352928.0/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置