[发明专利]一种文件比对方法、装置及服务器在审
申请号: | 201910720962.7 | 申请日: | 2019-08-06 |
公开(公告)号: | CN110532226A | 公开(公告)日: | 2019-12-03 |
发明(设计)人: | 杨伟图;陈影旺 | 申请(专利权)人: | 厦门网宿有限公司 |
主分类号: | G06F16/13 | 分类号: | G06F16/13;G06F16/14 |
代理公司: | 11573 北京华智则铭知识产权代理有限公司 | 代理人: | 王昌贵<国际申请>=<国际公布>=<进入 |
地址: | 361000 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 队列组 目标文件 源文件 比对结果 模数 哈希 计算机资源 取模运算 数据比对 数据对应 特征生成 文件比对 唯一性 数据组 比对 预设 服务器 分组 申请 | ||
1.一种文件比对方法,其特征在于,包括:
获取源文件与目标文件,所述源文件与所述目标文件分别包括多条数据;
根据所述数据的第一特征生成与所述数据对应的哈希值,将所述哈希值对预设数值进行取模运算得到模数,并根据所述模数分别对所述源文件和目标文件内的数据进行分组,得到源文件队列组和目标文件队列组,所述队列组由多个数据组组成,同一数据组内包括模数相同的至少一条数据;
根据相同模数的数据组比对所述源文件队列组和目标文件队列组中的数据,得到比对结果队列组;
根据所述比对结果队列组生成比对结果文件。
2.根据权利要求1所述的方法,其特征在于,所述数据的第一特征包括:数据ID;所述数据ID用于唯一标识一条数据。
3.根据权利要求2所述的方法,其特征在于,所述根据所述数据的第一特征生成与所述数据对应的哈希值,包括:根据所述数据ID生成与所述数据对应的整型哈希值。
4.根据权利要求1所述的方法,其特征在于,所述根据相同模数的数据组比对所述源文件队列组和目标文件队列组中的数据,得到比对结果队列组,包括:通过线程池并发比对所述源文件队列组和目标文件队列组中的数据,得到比对结果队列组。
5.根据权利要求4所述的方法,其特征在于,所述根据相同模数的数据组比对所述源文件队列组和目标文件队列组中的数据,得到比对结果队列组,包括:
比对所述源文件队列组和所述目标文件队列组中相同模数的数据组内的每一数据,得到所述两个相同模数的数据组的比对结果;
将所述源文件队列组和所述目标文件队列组中每两个数据组的比对结果作为比对结果队列组中对应位置处的比对结果。
6.根据权利要求5所述的方法,其特征在于,所述比对所述源文件队列组和所述目标文件队列组中相同模数的数据组内的每一数据得到所述两个相同模数的数据组的比对结果,包括:
比较所述源文件队列组与所述目标文件队列组中相同模数的数据组内数据ID相同的数据是否相同;所述数据ID用于唯一标识一条数据;
若不相同,将所述源文件队列组组内该数据ID对应的数据作为所述两个数据组的比对结果;或者,若相同,所述两个数据组的比对结果为空值。
7.根据权利要求5所述的方法,其特征在于,所述比对所述源文件队列组和所述目标文件队列组中相同模数的数据组内的每一数据,得到所述两个相同模数的数据组的比对结果,包括:计算每条数据的哈希值,将所述相同模数的两个数据组内相同数据ID的数据的哈希值进行比较,得到所述两个相同模数的数据组的比对结果。
8.根据权利要求5所述的方法,其特征在于,根据所述比对结果队列组生成比对结果文件,包括:将所述比对结果队列中的数据按照数据ID进行合并得到比对结果文件。
9.一种文件比对装置,其特征在于,包括:文件获取单元、数据分组单元、比对单元和比对结果生成单元;所述比对单元为多个;
所述文件获取单元,用于获取源文件与目标文件;所述源文件与所述目标文件分别包括多条数据;
所述数据分组单元,用于根据所述数据的第一特征生成与所述数据对应的哈希值,将所述哈希值对预设数值进行取模运算得到模数,并根据所述模数分别对所述源文件和目标文件内的数据进行分组,得到源文件队列组和目标文件队列组,所述队列组由多个数据组组成,同一数据组内包括模数相同的至少一条数据;
所述比对单元,用于根据相同模数的数据组比对所述源文件队列组和目标文件队列组中的数据,得到比对结果队列组;
所述比对结果生成单元,用于根据所述比对结果队列组生成比对结果文件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门网宿有限公司,未经厦门网宿有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910720962.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:存储引擎切换方法、装置、电子设备和介质
- 下一篇:作业数量查询方法及装置