[发明专利]一种字段存储方法、装置、设备及存储介质在审
申请号: | 202110559373.2 | 申请日: | 2021-05-21 |
公开(公告)号: | CN113297219A | 公开(公告)日: | 2021-08-24 |
发明(设计)人: | 张永兴;孙华锦;王江;李树青 | 申请(专利权)人: | 山东云海国创云计算装备产业创新中心有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/27 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 侯珊 |
地址: | 250001 山东省济南市自由贸易试验*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 字段 存储 方法 装置 设备 介质 | ||
1.一种字段存储方法,其特征在于,包括:
获取待存储的第一字段;
根据哈希位宽确定所述第一字段的第一哈希值;
确定与所述第一字段对应的第一二进制信息;
从所述第一二进制信息中确定原文标签,其中,所述原文标签的位数为所述第一二进制信息的总位数与所述哈希位宽之差;
利用所述第一哈希值将所述原文标签存储至哈希表。
2.根据权利要求1所述的字段存储方法,其特征在于,从所述第一二进制信息中确定原文标签,包括:
从所述第一二进制信息的低位中截取低位信息作为所述原文标签。
3.根据权利要求1所述的字段存储方法,其特征在于,从所述第一二进制信息中确定原文标签,包括:
从所述第一二进制信息的高位中截取高位信息作为所述原文标签。
4.根据权利要求2所述的字段存储方法,其特征在于,所述第一二进制信息的总位数的确定方法包括:
确定所述第一字段的总字节数;
将所述总字节数与8的乘积作为所述总位数。
5.根据权利要求1至4中任意一项所述的字段存储方法,其特征在于,利用所述第一哈希值将所述原文标签存储至哈希表之后,还包括:
接收数据查重指令;所述数据查重指令中携带待查重的第二字段;
根据所述哈希位宽确定所述第二字段的第二哈希值;
确定与所述第二字段对应的第二二进制信息;
从所述第二二进制信息中确定待查重标签,其中,所述待查重标签的位数为所述第二二进制信息的总位数与所述哈希位宽之差;
判断所述待查重标签与所述哈希表中存储的与所述第二哈希值对应的原文标签是否相同;
若相同,则判定所述第二字段为重复字段;若不相同,则判定所述第二字段为非重复字段。
6.一种字段存储装置,其特征在于,包括:
获取模块,用于获取待存储的第一字段;
第一哈希值确定模块,用于根据哈希位宽确定所述第一字段的第一哈希值;
第一二进制信息确定模块,用于确定与所述第一字段对应的第一二进制信息;
第一标签确定模块,用于从所述第一二进制信息中确定原文标签,其中,所述原文标签的位数为所述第一二进制信息的总位数与所述哈希位宽之差;
存储模块,用于利用所述第一哈希值将所述原文标签存储至哈希表。
7.根据权利要求6所述的字段存储装置,其特征在于,所述标签确定模块包括:
第一标签确定单元,用于从所述第一二进制信息的低位中截取低位信息作为所述原文标签。
8.根据权利要求6所述的字段存储装置,其特征在于,所述标签确定模块包括:
第二标签确定单元,用于从所述第一二进制信息的高位中截取高位信息作为所述原文标签。
9.一种电子设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至5任一项所述的字段存储方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述的字段存储方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东云海国创云计算装备产业创新中心有限公司,未经山东云海国创云计算装备产业创新中心有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110559373.2/1.html,转载请声明来源钻瓜专利网。