[发明专利]一种满足本地差分隐私的轨迹数据收集方法及系统在审
申请号: | 202111391595.4 | 申请日: | 2021-11-23 |
公开(公告)号: | CN114091100A | 公开(公告)日: | 2022-02-25 |
发明(设计)人: | 程祥;苏森;杨健宇;李悦嘉 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06K9/62 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 牛峥;王丽琴 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 满足 本地 隐私 轨迹 数据 收集 方法 系统 | ||
本申请公开了一种满足本地差分隐私的轨迹数据收集方法及系统,本申请实施例提供的方法,首先,将设定的地理区域进行网栅离散化,在地理区域内形成满足本地差分隐私的网栅,以离散用户的轨迹数据;其次,根据形成的网栅,离散化用户的轨迹数据,即将用户的轨迹数据中的每个地理位置替换为该位置所在晶格的索引值;再次,以在网栅中的每个晶格内的用户轨迹数据为样本,学习得到隐马尔科夫模型;最后,从学习得到的隐马尔科夫模型中抽样生成该地理区域的轨迹数据集。由于在用户轨迹数据收集过程中每个用户的轨迹数据都通过最优本地哈希法进行扰动处理,所以解决了用户隐私泄露问题,提供的设定地理区域的轨迹数据集中剔除了用户隐私信息。
技术领域
本申请涉及人工智能技术领域,特别涉及一种满足本地差分隐私的轨迹数据收集方法及系统。
背景技术
用户轨迹数据指的是一系列地理位置按时间先后排列而成的序列,其描述用户在地理区域中的移动信息。随着智能移动设备的深入普及,用户轨迹数据已经开始被许多服务提供商广泛地收集,通过分析获取到的用户轨迹数据,服务提供商可以提供更好的用户体验和创造新的盈利机会。例如,通过分析用户的移动模式,服务提供商可以帮助用户合理地规划出行路线,以避免交通拥堵,也能够向商业公司建议在用户经常访问的地点放置广告。然而,用户的轨迹数据可能会包含大量的敏感信息,比如家庭住址或一些敏感地点(如专科医院)的到访记录,如果没有合适的隐私保护机制,直接收集用户的轨迹数据将会把用户的个人隐私置于危险之中,同时也会因为用户不愿再分享轨迹数据而阻碍商业的运营发展。因此,如何设计有效的方法以解决在收集用户轨迹数据时的用户隐私泄露问题已迫在眉睫。
近年来提出的本地差分隐私(Local Differential Privacy)技术为解决上述问题提供了一种可行的方法。与假设存在一个可信的及具有访问用户真实数据权限的数据收集者的传统差分隐私技术不同,本地差分隐私技术无需对数据收集者的可信性做出任何限定。特别地,该技术要求数据贡献者首先向其拥有的数据中添加适量的噪音,然后再将含有噪音的数据发送给数据收集者,以实现对数据贡献者的隐私保护。但是,本地差分隐私技术并没有应用到用户轨迹数据的收集方法中,无法解决在用户轨迹数据收集过程中的用户隐私泄露问题。
发明内容
有鉴于此,本申请实施例提供一种满足本地差分隐私的轨迹数据收集方法及系统,该方法能够解决在用户轨迹数据收集过程中的用户隐私泄露问题。
本申请实施例是这样实现的:
本申请实施例提供一种满足本地差分隐私的轨迹数据收集方法,所述方法包括:
将设定的地理区域进行网栅离散化,在地理区域内形成满足本地差分隐私的网栅;
基于所述形成的网栅,离散化用户的轨迹数据,将用户的轨迹数据中的每个地理位置以所述地理位置所在晶格的索引值标识;
以在网栅中的每个晶格内的用户轨迹数据为样本,学习得到隐马尔科夫模型;
从学习得到的隐马尔科夫模型中抽样生成该地理区域的轨迹数据集。
本申请实施例还提供一种满足本地差分隐私的轨迹数据收集系统,其特征在于,所述系统包括:多个数据贡献实体及一数据收集实体,其中,
数据收集实体,用于将地理区域进行网栅离散化,在地理区域内形成网栅;基于所述形成的网栅,离散化从数据贡献实体接收的用户的轨迹数据,将用户的轨迹数据中的每个地理位置以所述地理位置所在晶格的索引值标识;以在网栅中的每个晶格内的用户轨迹数据作为样本,学习得到隐马尔科夫模型;从学习得到的隐马尔科夫模型中抽样生成该地理区域的轨迹数据集;
数据贡献实体,用于提供用户的轨迹数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111391595.4/2.html,转载请声明来源钻瓜专利网。