[发明专利]面向文本检索服务的用户隐私保护方法有效
申请号: | 201710341742.4 | 申请日: | 2017-05-15 |
公开(公告)号: | CN107292189B | 公开(公告)日: | 2018-12-25 |
发明(设计)人: | 吴宗大;郑城仁 | 申请(专利权)人: | 温州大学瓯江学院 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F17/30 |
代理公司: | 杭州杭诚专利事务所有限公司 33109 | 代理人: | 王江成 |
地址: | 325027 浙江省温州市瓯海区瓯海*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 文本 检索 服务 用户 隐私 保护 方法 | ||
本发明公开了面向文本检索服务的用户隐私保护方法,属于文本检索隐私保护技术领域,该方法在用户进行文本检索服务时,能确保用户查询隐私和用户主题隐私在不可信服务器端的安全性。用户隐私保护过程如下:首先,给出面向文本检索服务的隐私保护框架;然后,基于以上隐私保护框架,定义一个面向文本检索服务的隐私保护模型,该隐私保护模型形式化地定义了理想伪查询应满足的条件约束;最后,基于以上隐私保护框架和隐私保护模型,给出隐私保护模型的模型求解算法。
技术领域
本发明涉及文本检索隐私保护技术领域,具体涉及面向文本检索服务的用户隐私保护方法。
背景技术
随着互联网的迅速发展,网络上的文本数据持续爆炸式地增长。文本检索服务能够根据用户所提供的查询关键词,帮助用户从海量文本数据中快速地获取想要的数据,已经成为最热门的网络服务之一。实际上,不再局限于网页文本搜索,文本检索已经被广泛地应用于网络信息服务的各个领域(如数字图书馆、电子商务网站、企业信息管理等),并取得了巨大的成功。虽然文本检索服务能够帮助用户直观有效地获取非结构文本数据,然而,用户所提交的查询可能会潜在地泄露用户的用户隐私信息,从而引发用户隐私安全问题。
文本检索服务中,用户查询行为可能泄露的用户隐私可分为两类。
一是查询本身的关键词隐私,简称查询隐私,即用户希望别人无法获知自己发布过的查询,或者不能确定是否发布过该查询。例如,用户希望别人无法获知或不确定自己是否查询过关键词“沙漠之鹰”和“手枪”。
二是查询关键词蕴含的敏感主题,简称主题隐私,即用户希望别人无法获知自己感兴趣的主题,尤其是敏感主题。例如,用户不希望别人知道对敏感主题“武器”或“战争”感兴趣。
用户查询行为所携带的这些隐私信息被不可信的文本检索服务器端(即文本检索服务算法宿主)大量地收集,将会对用户隐私安全构成严重的威胁,引起用户极大的关注。如何有效地保护用户隐私安全(包括查询隐私和主题隐私)已成为文本检索服务亟待解决的重要问题。
发明内容
本发明是为了解决现有文本检索隐私保护存在的上述不足,提供一种面向文本检索服务的用户隐私保护方法,该方法在用户进行文本检索服务时,能确保用户查询隐私和用户主题隐私在不可信服务器端的安全性。
以上技术问题是通过下列技术方案解决的:
面向文本检索服务的用户隐私保护方法,所述用户隐私保护过程如下:
首先,给出面向文本检索服务的隐私保护框架;
然后,基于以上隐私保护框架,定义一个面向文本检索服务的隐私保护模型,该隐私保护模型形式化地定义了理想伪查询应满足的条件约束;
最后,基于以上隐私保护框架和隐私保护模型,给出隐私保护模型的模型求解算法。
作为优选,所述隐私保护框架由一个不可信服务器端和一组可信客户端组成,该隐私保护框架的数据处理过程如下:
客户端的“用户伪查询构造”部件用于分析用户查询q0的分布特征,结合客户端的“历史查询序列”构造生成一系列伪查询:q1,q2,...,qn;然后,将这些伪查询连同用户真实查询q0按照随机的次序,逐个提交给服务器端的检索服务算法;
所述历史查询序列包括用户真实查询序列以及伪查询序列;
客户端的“服务结果再筛选”部件从服务器端检索服务算法所返回的中间查询结果集:中筛选出对应用户真实查询q0的结果同时抛弃其它多余查询结果其中,对应查询qi,然后,将最终结果返回给外部用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于温州大学瓯江学院,未经温州大学瓯江学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710341742.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种控制用户访问权限的方法和装置
- 下一篇:一种信息处理方法及移动终端