[发明专利]利用串匹配进行数据同步的方法和系统有效
申请号: | 201110252194.0 | 申请日: | 2011-08-30 |
公开(公告)号: | CN102955816A | 公开(公告)日: | 2013-03-06 |
发明(设计)人: | 张凯;高英明;霍嘉;邹献;杨远琳;肖红 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市中咨律师事务所 11247 | 代理人: | 张亚非;于静 |
地址: | 美国*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 利用 匹配 进行 数据 同步 方法 系统 | ||
技术领域
本发明涉及数据或文件同步技术领域。更具体地,本发明尤其涉及利用字符串匹配算法进行数据同步的方法和系统。
背景技术
目前,越来越多的应用程序具有储存于不同的计算机上的数据或文件,并且需要保证当在其中一个计算机节点上对数据或文件进行更新后,能够在其它多个计算机上同步这些更新。通常,数据更新发生的原始计算机或计算节点被称作源节点,而待同步的其它计算机或计算节点被称作目标节点。进一步地,这样的数据同步需求在云计算(Cloud Computing)环境下更加迫切,例如在云存储(Cloud Storage)环境下,数据及文件冗余地分布在多个不同的节点上,需要数据同步技术来保证云环境下多个不同节点间的数据及文件同步。
现有技术中存在一些解决数据同步问题的技术方案。根据现有技术中的一种解决方案,当源节点中的文件被更新时,直接将更新后的文件整体传送至其它远程或本地的需要同步该文件的目标节点。该技术方案的一个明显缺点是:即使文件中只有一个字节被更新,也要传送整个文件,从而造成对时间和网络资源的大量不必要耗费。
根据现有技术中的另一种解决方案,是将数据或文件的旧拷贝分成固定长度的数据块,当数据或文件在源节点中被更新后,利用哈希算法(Hash)在数据或文件的新拷贝中识别这些数据块,然后将更新后的文件中的数据块的位置信息以及更新了的数据块的内容发送至目标节点以实现数据同步。这种技术方案的明显缺点是:哈希运算会耗费大量的CPU资源,并且大量的数据块内容和位置的传输会消耗过多的网络资源。
因此,需要一种避免传输全部文件内容来计算新旧数据或文件间的差异的在源节点和目标节点间进行数据同步的方法。
发明内容
考虑到上述存在的问题,本发明的目的之一在于提供一种能够在源节点和目标节点间进行数据同步的方法或系统。本发明的又一目的在于提供一种避免传输全部文件内容的数据同步方法或系统。本发明的再一目的在于提供一种避免使用哈希算法来计算新旧文件间的差异的数据同步的方法或系统。本发明并非需要同时达成上述三个目的,而只需满足三个目的之一即可。
根据本发明的一个方面,提供了一种用于数据同步的方法,包括:获取待同步数据位于源节点的旧拷贝和新拷贝;利用字符串匹配,确定所述旧拷贝和新拷贝间的差异以生成区块图;以及将所生成的区块图发送至目标节点,以将所述目标节点的待同步数据的旧拷贝同步为所述新拷贝。
根据本发明的另一方面,提供了一种用于数据同步的系统,包括:获取装置,被配置为获取待同步数据位于源节点的旧拷贝和新拷贝;区块图生成装置,被配置为利用字符串匹配,确定所述旧拷贝和新拷贝间的差异以生成区块图;以及发送装置,被配置为将所生成的区块图发送至目标节点,以将所述目标节点的待同步数据的旧拷贝同步为所述新拷贝。
根据本发明的方法和系统,通过字符串匹配的方式,可以识别出新、旧数据间的差异以实现目标节点和源节点间的数据同步,在数据同步的过程中仅需传输必要的内容并且无需利用哈希算法。
附图说明
通过对结合附图所示出的实施方式进行详细说明,本发明的上述以及其他特征将更加明显,本发明附图中相同的标号表示相同或相似的部件。在附图中,
图1示出了适于用来实现本发明实施方式的示例性计算系统100的框图。
图2示出了根据本发明一个实施例的用于数据同步的方法的流程图;
图3示出了根据本发明另一实施例的用于数据同步的方法的流程图;
图4A至4G是示出了根据本发明一个实施例的区块图的生成过程的各阶段以及在目标节点同步数据的示意图;
图5示出了根据本发明一个实施例的用于数据同步的系统的框图。
具体实施方式
在下文中,将参考附图通过实施方式对本发明提供的用于数据同步的方法和系统进行详细地描述。
所属技术领域的技术人员知道,本发明的多个方面可以体现为系统、方法或计算机程序产品。因此,本发明的多个方面可以具体实现为以下形式,即,可以是完全的硬件、完全的软件(包括固件、驻留软件、微代码等)、或者本文一般称为“电路”、“模块”或“系统”的软件部分与硬件部分的组合。此外,本发明的多个方面还可以采取体现在一个或多个计算机可读介质中的计算机程序产品的形式,该计算机可读介质中包含计算机可用的程序码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110252194.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新型的汽车内用脚垫
- 下一篇:LED光疗仪
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置