[发明专利]语义指纹查询方法、装置、设备和存储介质在审
| 申请号: | 202111078932.4 | 申请日: | 2021-09-15 |
| 公开(公告)号: | CN113821599A | 公开(公告)日: | 2021-12-21 |
| 发明(设计)人: | 曲子乐 | 申请(专利权)人: | 北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/953 |
| 代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 杨泽;黄健 |
| 地址: | 100176 北京市经济技术开*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语义 指纹 查询 方法 装置 设备 存储 介质 | ||
1.一种语义指纹查询方法,其特征在于,所述方法包括:
获取目标语义指纹;
根据海明距离的预设数值、分块数量和所述目标语义指纹,确定所述目标语义指纹的查询条件;
根据所述查询条件,在语义指纹库中确定查询结果;其中,所述语义指纹库中的语义指纹的位数与所述目标语义指纹的位数相同。
2.根据权利要求1所述的方法,其特征在于,根据海明距离的预设数值、分块数量和所述目标语义指纹,确定所述目标语义指纹的查询条件,包括:
将所述目标语义指纹的位数按照所述分块数量进行划分,得到所述目标语义指纹位数的初次分段结果;
根据所述初次分段结果、所述海明距离的预设数值和所述分块数量,确定二次分段结果;
根据所述初次分段结果和所述二次分段结果,确定所述目标语义指纹的查询条件。
3.根据权利要求2所述的方法,其特征在于,将所述目标语义指纹的位数按照所述分块数量进行划分,得到所述目标语义指纹位数的初次分段结果,包括:
将所述目标语义指纹的位数按照所述分块数量划分至第一分段中;其中,所述第一分段的子段数量与所述分块数量相同;
根据所述海明距离的预设数值,在所述第一分段中确定与所述海明距离不同的第一子段;
根据所述第一分段和所述第一子段,计算第二子段;
将所述第二子段作为所述初次分段结果。
4.根据权利要求3所述的方法,其特征在于,根据所述初次分段结果、所述海明距离的预设数值和所述分块数量,确定二次分段结果,包括:
将所述第一子段按照所述分块数量划分至第二分段中;其中,所述第二分段的子段数量与所述分块数量相同;其中,所述第二分段的字段区间在所述第一子段的字段区间内;
根据所述海明距离的预设数值,在所述第二分段中确定与所述海明距离不同的第三子段;
根据所述第二分段和所述第三子段,计算第四子段;
将所述第四子段作为所述二次分段结果。
5.根据权利要求2所述的方法,其特征在于,根据所述初次分段结果和所述二次分段结果,确定所述目标语义指纹的查询条件,包括:
将所述初次分段结果与所述二次分段结果进行加和,得到所述查询条件。
6.根据权利要求1所述的方法,其特征在于,根据所述查询条件,在语义指纹库中确定查询结果之后,还包括:
根据所述海明距离的预设数值,对所述查询结果中每一个字段存储位数的数值与所述目标语义指纹进行匹配,得到所述匹配结果;
将所述匹配结果输出至用户。
7.根据权利要求1-6中任一项所述的方法,其特征在于,所述语义指纹库中的语义指纹的位数按照预设的位数进行分段,并构建在倒排索引结构中。
8.一种语义指纹查询装置,其特征在于,所述装置包括:
获取模块,用于获取目标语义指纹;
查询条件确定模块,用于根据海明距离的预设数值、分块数量和所述目标语义指纹,确定所述目标语义指纹的查询条件;
查询结果确定模块,用于根据所述查询条件,在语义指纹库中确定查询结果;其中,所述语义指纹库中的语义指纹的位数与所述目标语义指纹的位数相同。
9.一种计算机设备,包括:存储器,处理器;
存储器;用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为:
所述处理器被配置为执行如权利要求1至7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1至7任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司,未经北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111078932.4/1.html,转载请声明来源钻瓜专利网。





