[发明专利]基于Laplacian算子和LSH技术的检索方法及其系统有效

专利信息
申请号: 202110719254.9 申请日: 2021-06-28
公开(公告)号: CN113535717B 公开(公告)日: 2023-07-18
发明(设计)人: 张仕;赖会霞 申请(专利权)人: 福建师范大学
主分类号: G06F16/22 分类号: G06F16/22;G06F16/2458;G06F16/248
代理公司: 福州君诚知识产权代理有限公司 35211 代理人: 戴雨君
地址: 350108 福建省福州*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 laplacian 算子 lsh 技术 检索 方法 及其 系统
【权利要求书】:

1.基于Laplacian算子和LSH技术的检索方法,其特征在于:其包括以下步骤:

步骤1,生成k个哈希函数组成的哈希函数簇,每个哈希函数构造时,把数据投影到符合高斯分布的随机向量上,根据投影的高斯核概率密度分布和高斯核Laplacian算子求得的投影二阶导数确定偏移量,由随机向量和偏移量共同确定一个哈希函数;哈希函数簇构造步骤如下:

步骤1-1,从数据集X中随机获取N′=N*sr个样本形成样本数据集X′,其中sr为采样率,0sr=1;N=|X|为原数据集元素个数。

步骤1-2,生成每个维度取值范围,每个维度取值范围依次叠加形成数组cutPos;

步骤1-3,逐个生成k个投影平面(w[i],b),k为编码长度;每个投影平面先生成d′个符合正态分布的随机向量,利用cutPos[.]确定选中概率为投影平面的w[i]中的d′个元素赋值,其余赋值为0,同时计算每个投影平面的偏移量b;偏移量b的计算步骤如下:

步骤1-3-1,样本数据集X′在wi所表示的平面法向量上进行投影;

步骤1-3-2,计算高斯核带宽h,计算公式为:h=1.06An-1/5       (13);

其中A=min(标准差σ,四分位数/1.34),n=N′表示样本元素个数;

步骤1-3-3,利用高斯核函数进行概率密度估计得到高斯核密度概率分布函数;具体步骤如下:

步骤1-3-3-1,采用一维高斯函数作为概率密度估计的核,表达式如下:

步骤1-3-3-2,得到高斯核密度函数

步骤1-3-3-3,投影区间[projmin=min(Xproj′),projmax=max(Xproj′)]分为M等份,每等份宽度为step;第k个位置的高斯核密度值计算如下:

步骤1-3-3-4,计算高斯核密度概率分布函数:

步骤1-3-4,利用高斯核Laplacian算子求概率密度二阶导数;

步骤1-3-5,基于概率密度的二阶导数值及概率密度分布函数确定超平面的偏移值b;

步骤2,数据存储过程中利用哈希函数簇逐个计算所要存储数据的哈希编码,并把数据ID存入对应编码的哈希桶;

步骤3,数据查询阶段,用相同的哈希函数簇计算查询对象的哈希编码,根据哈希编码定位哈希桶得到候选数据集,再逐个计算出候选数据集与查询对象的实际距离,排序并返回查询结果。

2.根据权利要求1所述的基于Laplacian算子和LSH技术的检索方法,其特征在于:步骤1-3-4的具体步骤如下:

步骤1-3-4-1,高斯核Laplacian算子计算高斯核概率密度二阶导数如下:

步骤1-3-4-2,按步长step求M个位置的概率密度函数的二阶导数,具体公式如下:

3.基于Laplacian算子和LSH技术的检索系统,采用了权利要求1至2任一所述的基于Laplacian算子和LSH技术的检索方法,其特征在于:系统包括哈希函数构造单元、数据存储单元和数据查询单元,哈希函数构造单元用于分析数据并最终生成k个哈希函数参数,形成哈希函数簇;哈希函数构造单元通过把数据投影到符合高斯分布的随机向量上,根据投影的高斯核概率密度分布和高斯核Laplacian算子求得的投影二阶导数和确定偏移量作为哈希函数参数;数据存储单元用于对所要存储数据利用对应的哈希函数簇逐个计算所要存储数据的哈希编码,并把数据ID存入对应编码的哈希桶;数据查询单元用于数据查询阶段对查询数据采用相同的哈希函数簇计算查询对象的哈希编码,根据哈希编码定位哈希桶得到候选数据集,再逐个计算出候选数据集与查询对象的实际距离,排序并返回查询结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福建师范大学,未经福建师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110719254.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top