[发明专利]一种密文的多关键字分级安全检索方法在审
申请号: | 201710827310.4 | 申请日: | 2017-09-14 |
公开(公告)号: | CN107704768A | 公开(公告)日: | 2018-02-16 |
发明(设计)人: | 蒋雁梅;韩德志;毕坤;王军;田秋亭 | 申请(专利权)人: | 上海海事大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F17/30;H04L9/00;H04L9/30;H04L29/06;H04L29/08 |
代理公司: | 上海三和万国知识产权代理事务所(普通合伙)31230 | 代理人: | 陈伟勇 |
地址: | 201306 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 关键字 分级 安全 检索 方法 | ||
技术领域
本发明涉及网络密文检索,具体是一种密文的多关键字分级安全检索方法。
背景技术
目前,采用分级的多关键字同态加密技术实现密文在安全性、精度和效率上三大综合指标的检索,是目前云环境下的密文检索技术的主要挑战。新型的多关键字分级检索方法在对文档关键字的检索上更有优势:一方面多关键字检索提供了精炼的检索结果;另一方面多关键字检索解决了云存储下用户的隐私与数据安全的问题,同时也是实现高级查询功能的基础。
该方法的综合优势体现的前提是云存储服务器作为可信第三方,对于上传的数据没有任何泄露的可能。然而,目前的云存储服务器并不总是可靠的。自云计算诞生之日起,便伴随着数据泄露的安全事件。2016年4月,土耳其发生重大数据泄露,直接导致约近5000万人的信息得到公开。2016年5月,轻博客网站Tumblr超过6500万邮箱账号和密码泄露。2016年6月,美国LinkedIn超过1.67亿个账户被公开销售。2016年12月,京东出现大规模数据泄露,约12G的用户数据信息流出,这些安全威胁不仅严重阻碍了云计算的发展,而且严重阻碍了云数据的高效使用。
为了在保护用户隐私的同时,使云数据获得高效的利用,多关键字分级检索技术通过构造可搜索的加密方案,在保护用户数据的前提下,给用户提供有效的检索服务。数据拥有者在上传数据时,首先利用加密方案对原始数据和索引进行加密,然后再上传到云端。检索时,根据用户的查询内容构建查询门限,然后云存储服务器在密文环境下进行相关分数计算,最后根据相关分数得分排序输出计算结果。整个过程中,云存储服务器得到的数据和进行的计算都是在加密环境下进行的。该方案利用向量空间模型构建可搜索索引,使用同态加密算法进行加解密,支持查询结果的分级检索,有效避免了服务器端返回相关度不大的文件,降低了通信开销,也消除了不必要的流量开销。而且既能在效率,安全性和精度上进行密文检索,又能满足用户需求的方案,而目前还少见文献报道。
发明内容
本发明提供的一种密文的多关键字分级安全检索方法,支持多关键字分级检索的同时保护了用户的查询隐私,增强了多关键字可搜索加密方案的安全性,提高了云环境中多关键字密文检索的效率,减少了数据使用者检索的工作量,提高了文件的查准率。
为了达到上述目的,本发明提供一种密文的多关键字分级安全检索方法,该算法包含以下步骤:
步骤1、使用同态加密算法生成公私钥:数据拥有者需要将文件集中所有文件上传至云存储服务器,上传之前需要对文件集进行加密,数据拥有者调用KeyGen生成同态加密算法的公私钥PK,SK;
所述的KGen算法指的是同态加密方案中的密钥生成算法;
所述的PK指的是同态算法生成的公钥,SK指的是同态算法生成的私钥;
步骤2、对文件向量构成可搜索索引:数据拥有者从包含的数据集中提取关键字集合,并且计算每个关键字的词频和逆文件频率,对每个文件生成文件向量,对所有的文件向量构成可搜索索引并使用同态加密算法进行加密生成安全的可搜索索引;
所述可搜索索引指的是为文件集合每一个文件中的文件生成一个它所包含的所有关键字的序列。
所述的词频指的是某一个关键字在该文件中出现的频率;
所述的逆文件频率指的是对一个关键字普遍重要性的度量;(可以由总文件数目除以包含该关键字文件的数目,再将得到的商取对数得到。)
所述的同态加密算法指的是允许直接对密文进行操作的加密变换算法。
步骤3、将检索请求生成陷门向量:当数据使用者想要检索某些包含特定关键字的文件时,检索请求向量被扩展成陷门向量。数据拥有者使用同态加密算法加密陷门向量,得到安全的陷门向量,最后安全的陷门向量传送至云存储服务器;
所述的陷门向量指的是数据使用者利用密钥生成的与他输入的关键字集合相对应的安全门限;
步骤4、用户选择前k个相关性最高的文件进行检索:云存储服务器在接收到安全的陷门后计算该文件与该请求的相关性分数的密文,若相关性分数越高,则文件中含有的被检关键字数量越多,云存储服务器返回加密的相关性分数的序列,数据使用者解密相关性分数序列,排序后把前k个分级的文件标识符发送给云存储服务器,然后数据使用者便可以检索到相关的文件;
所述的相关性分数指的是文件向量和查询向量的内积;
所述的文件标识符指的是唯一的能够标识文档的ID符号,此标识符是由服务器提供。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海海事大学,未经上海海事大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710827310.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种菜单显示方法和装置
- 下一篇:电子书显示方法、终端和计算机可读存储介质