[发明专利]压缩装置、存储介质及重复信息查询、更新的方法和装置有效
申请号: | 201910322812.0 | 申请日: | 2019-04-22 |
公开(公告)号: | CN111835359B | 公开(公告)日: | 2022-03-22 |
发明(设计)人: | 陈迅;朱剑文 | 申请(专利权)人: | 深圳捷誊技术有限公司 |
主分类号: | H03M7/30 | 分类号: | H03M7/30;G06F16/174;G06F16/14 |
代理公司: | 深圳市顺天达专利商标代理有限公司 44217 | 代理人: | 郭伟刚 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 压缩 装置 存储 介质 重复 信息 查询 更新 方法 | ||
1.一种无损压缩重复信息查询的方法,用于查询当前的待匹配数据在待压缩数据中的重复信息,其特征在于,所述方法包括:
计算当前的待匹配数据的数据头所对应的哈希值;
查找历史信息表的与计算出的哈希值对应的入口,并确定所查到的入口中的多路历史信息项目,其中,每一路历史信息项目包括取自待压缩数据的原始数据,所述多路历史信息项目中的原始数据的数据头所对应的哈希值均与当前的待匹配数据的数据头所对应的哈希值相同;历史信息表中分为两个部分,第一部分是待压缩数据中的原始数据,第二部分是该原始数据首字符到待压缩序列首字符的距离;
将当前的待匹配数据与查找到的多路历史信息项目中的原始数据进行匹配对比,选择匹配长度最长的原始数据所在的历史信息项目作为查询结果输出;
所述历史信息表包括2P个入口,所述2P个入口与哈希值的2P个取值一一对应,P表示哈希值的比特位数;每个入口包括N路相关联的历史信息项目,N为大于1的一个预设的正整数;每一所述历史信息项目包括所述原始数据以及所述原始数据的首字符在待压缩数据中的索引,所述原始数据初始为空,且在重复信息更新过程中每一次的待匹配数据会替换掉差异最小的原始数据;
将当前的待匹配数据与查找到的多路历史信息项目中的原始数据分别进行异或操作,并分别统计多路历史信息项目对应的异或结果中的1的个数,统计到的1的个数越多说明差异越大,统计到的1的个数越少则代表匹配度越高,代表差异越小。
2.一种无损压缩重复信息更新的方法,用于更新待压缩数据中的重复信息,其特征在于,所述方法包括:
计算当前的待匹配数据的数据头所对应的哈希值;
查找历史信息表的与计算出的哈希值对应的入口,并确定所查到的入口中的多路历史信息项目,其中,每一路历史信息项目包括取自待压缩数据的原始数据,所述多路历史信息项目中的原始数据的数据头所对应的哈希值均与当前的待匹配数据的数据头所对应的哈希值相同;历史信息表中分为两个部分,第一部分是待压缩数据中的原始数据,第二部分是该原始数据首字符到待压缩序列首字符的距离;
将当前的待匹配数据与查找到的多路历史信息项目中的原始数据进行差异对比,将当前的待匹配数据替换掉差异最小的原始数据,包括:
将当前的待匹配数据与查找到的多路历史信息项目中的原始数据分别进行异或操作,并分别统计多路历史信息项目对应的异或结果中的1的个数,统计到的个数越少则代表差异越小;
所述历史信息表包括2P个入口,所述2P个入口与哈希值的2P个取值一一对应,P表示哈希值的比特位数;每个入口包括N路相关联的历史信息项目,N为大于1的一个预设的正整数;每一所述历史信息项目包括所述原始数据以及所述原始数据的首字符在待压缩数据中的索引,所述原始数据初始为空。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:在将当前的待匹配数据替换掉差异最小的原始数据的同时,还将当前的待匹配数据的首字符的索引替换掉差异最小的原始数据所在历史信息项目中的索引。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳捷誊技术有限公司,未经深圳捷誊技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910322812.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多旋翼无人机的整流罩结构
- 下一篇:电阻式随机存取存储器结构及其制造方法