[发明专利]基于属性的多关键词相似排名搜索的数据密文查询方法在审
| 申请号: | 202211139017.6 | 申请日: | 2022-09-19 |
| 公开(公告)号: | CN115510463A | 公开(公告)日: | 2022-12-23 |
| 发明(设计)人: | 孟倩;胡家民;沈忠华;陈克非;刘勇;王付群;张仁军 | 申请(专利权)人: | 杭州师范大学 |
| 主分类号: | G06F21/60 | 分类号: | G06F21/60;G06F21/62;G06F21/31;G06F16/33 |
| 代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱亚冠 |
| 地址: | 311121 浙江*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 属性 关键词 相似 排名 搜索 数据 查询 方法 | ||
1.基于属性的多关键词相似排名搜索的数据密文查询方法,其特征在于该方法包括以下步骤:
步骤S1:数据用户获取可搜索加密密钥、对称加密密钥、总关键词字典及其关键词对应的逆文件频率数据向量:
步骤S2:数据拥有者对电子文档生成TF数据向量组,第二IDF数据向量;具体是:
2-1数据拥有者从电子文档集中提取所有关键词,将所有关键词去重组成关键词字典W={ω1,ω2,...,ωn},对该关键词字典中的关键词进行分组,分成b组,每组有d个关键词,记作GW={G1,G2,...,Gb},其中Gi={ω(i-1)*d+1,ω(i-1)*d+2,…,ωi*d},计算每个关键词在每个电子文档的词频TF值;
2-2数据拥有者将每个电子文档转化为TF数据向量,再将所有的电子文档进行整合,从而生成TF数据向量组;
2-3数据拥有者对整个电子文档,进行关键词IDF计算,生成第一IDF数据向量;
2-4将第一IDF数据向量数乘十的任意整数倍,得到向量数乘结果;再在上述向量数乘结果与一个任意整数构成的向量相加,得到相加后的向量;接着在相加后的向量上增加γ个维度,最终得到第二IDF数据向量;
步骤S3:建立电子文档索引;具体是:
3-1数据拥有者随机生成四个维度为(d+3)*(d+3)的可逆矩阵{M1,M2,M3,M4},并将其组成可搜索加密密钥K,即K={M1,M2,M3,M4};
3-2数据拥有者生成传统对称加密算法的对称密钥sk;
3-3数据拥有者将每个电子文档对应的TF数据向量按照关键词字典中关键词分组的方式进行分组,即某个电子文档的TF数据向量的第i个分组是Gi中元素在该电子文档的TF值,则每个TF数据向量分组的维数是Gi中元素的个数d,每个TF数据向量分成了b组;
3-4数据拥有者对关键词字典中的每个分组里的各个元素进行逆文件搜索,找出其词频高的电子文档,用上述词频高的电子文档TF数据向量构建二叉树,对每个分组进行以上相同的步骤,共构建b个二叉树;
3-5将二叉树中的每个TF数据向量转化为数据对角矩阵,数据拥有者利用数据矩阵分裂方法,将每个电子文档对应的数据矩阵A分裂成两个随机的对角矩阵A1、A2,即A=A1A2=A2A1;
3-6数据拥有者将可搜索加密密钥K中四个可逆矩阵进行如下相乘,即A'=(M1A1M2)(M3A2M4),组成电子文档索引I;
3-7数据拥有者利用对称密钥sk对每个电子文档和索引I进行加密,得到密文C、索引I;
3-8数据拥有者将密文C,索引I打包发送给云服务器;
步骤S4:生成查询向量分组;
步骤S5:生成陷门;具体是:
5-1将每个查询向量分组添加预设增量维度a,然后将增量后的查询向量分组转化成多个对角矩阵得到查询矩阵;利用矩阵分裂方法,数据用户将每个查询矩阵分裂成两个随机的对角矩阵,得到子查询矩阵A3、A4;
5-2数据用户将可搜索加密密钥中四个可逆矩阵的逆{M1,M2,M3,M4}分别与子查询矩阵根据公式(3)计算得到查询向量分组的矩阵B';
将所有查询向量分组的矩阵B'组成查询请求的陷门T;
5-3数据用户向云服务器提交查询请求的陷门T;
步骤S6:查询密文,选出top-k电子文档;
步骤S7:解密返回的密文;具体是:
数据用户利用对称加密密钥sk,对接收到的k个密文进行解密,得到每个密文对应的明文。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州师范大学,未经杭州师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211139017.6/1.html,转载请声明来源钻瓜专利网。





