[发明专利]一种满足本地差分隐私的轨迹数据收集方法及系统在审
申请号: | 202111391595.4 | 申请日: | 2021-11-23 |
公开(公告)号: | CN114091100A | 公开(公告)日: | 2022-02-25 |
发明(设计)人: | 程祥;苏森;杨健宇;李悦嘉 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06K9/62 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 牛峥;王丽琴 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 满足 本地 隐私 轨迹 数据 收集 方法 系统 | ||
1.一种满足本地差分隐私的轨迹数据收集方法,其特征在于,所述方法包括:
将设定的地理区域进行网栅离散化,在地理区域内形成满足本地差分隐私的网栅;
基于所述形成的网栅,离散化用户的轨迹数据,将用户的轨迹数据中的每个地理位置以所述地理位置所在晶格的索引值标识;
以在网栅中的每个晶格内的用户轨迹数据为样本,学习得到隐马尔科夫模型;
从学习得到的隐马尔科夫模型中抽样生成该地理区域的轨迹数据集。
2.如权利要求1所述的方法,其特征在于,所述在地理区域内形成满足本地差分隐私的网栅包括:
在设定的地理区域中以第一网栅粒度g1进行粗划分,得到第一网栅G1;
针对第一网栅G1中的每个晶格,根据计算得到的所述晶格的频率确定第二网栅粒度g2,以第二网栅粒度g2对所述晶格进行划分,在地理区域内形成满足本地差分隐私的网栅。
3.如权利要求2所述的方法,其特征在于,所述得到第一网栅G1包括:
将所述地理区域划分为g1×g1的第一网栅G1,其中第一网栅粒度g1采用
设置;
其中,n是所述地理区域内的用户总数;ε是设置的隐私预算值;α设置为0.02。
4.如权利要求2所述的方法,其特征在于,所述根据计算得到的所述晶格的频率确定第二网栅粒度g2,以第二网栅粒度g2对所述晶格进行划分,在地理区域内形成满足本地差分隐私的网栅包括:
将确定的网栅G1,广播给从所述地理区域内的总用户中随机划分的第一用户小组U1中的每个用户,以使第一用户小组U1里每一个第i个用户将其轨迹数据离散化为其中是位置所在晶格的索引值,代表Ti在第j个时间节点上的地理位置;
采用最优本地哈希OLH机制从用户小组U1提供的离散化计算得到每个晶格的频率;
采用确定第二网栅粒度g2,
其中,n是所述地理区域内的用户总数;ε是设置的隐私预算值;α设置为0.02,及σ为表示从总用户中随机划分的用户小组U1中的用户数量占用户总数的比例,设置为0.2;
对于网栅G1里第k个晶格,根据其频率fk将其划分为个相同大小的晶格,在地理区域内形成满足本地差分隐私的网栅。
5.如权利要求4所述的方法,其特征在于,所述采用OLH机制从用户小组U1提供的离散化计算得到每个晶格的频率包括:
将用户小组U1等分成t个子小组,其中每个子小组内的用户报告离散化的轨迹数据中一个时间节点上的信息;
对于每一个第j个时间节点,通过OLH机制从第j个子小组离散化的轨迹数据中估算网栅G1里第k个晶格的频率网栅G1里第k个晶格的频率估算值fk被计算为所有t个时间节点上频率的平均值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111391595.4/1.html,转载请声明来源钻瓜专利网。