[发明专利]文档比较的差异输出方法、装置、存储介质及电子设备在审
申请号: | 201811592905.7 | 申请日: | 2018-12-25 |
公开(公告)号: | CN109740124A | 公开(公告)日: | 2019-05-10 |
发明(设计)人: | 韩志刚 | 申请(专利权)人: | 东软集团股份有限公司 |
主分类号: | G06F17/22 | 分类号: | G06F17/22 |
代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙) 11447 | 代理人: | 曾尧;魏嘉熹 |
地址: | 110179 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 数据块 差异数据块 存储介质 电子设备 差异类型 描述信息 删除数据 输出显示 自动统计 输出 准确率 | ||
本公开涉及一种文档比较的差异输出方法、装置、存储介质及电子设备,所述方法包括:获取第一文档和第二文档中的数据块的位置信息以及第二文档相对于第一文档的差异数据块的差异类型;根据位置信息,生成第二文档相对于第一文档的修改数据块和相同数据块的有序序列,并将第二文档相对于第一文档的增加数据块和删除数据块,插入到有序序列中,得到目标有序序列;根据第二文档相对第一文档的每一差异数据块在目标有序序列中的次序,输出显示每一所述差异数据块的差异描述信息。通过本公开的技术方案,可以实现对两篇文档的差异的自动统计,提高了效率和准确率。
技术领域
本公开涉及文字比较领域,具体地,涉及一种文档比较的差异输出方法、装置、存储介质及电子设备。
背景技术
在文字处理领域,文字比较功能会经常使用到,例如获取两篇文档之间的存在差异的数据块。为了便于用户查阅两篇文档的差异信息,通常对这些数据块进行统计。
现有技术中,通常需要通过人工统计两篇文档的差异数据块,该方式的效率和准确度较低。
发明内容
为了克服现有技术中存在的问题,本公开的主要目的是提供一种文档比较的差异输出方法、装置、存储介质及电子设备。
为了实现上述目的,本公开实施例第一方面提供一种文档比较的差异输出方法,包括:
获取第一文档和第二文档中的数据块的位置信息以及所述第二文档相对于所述第一文档的差异数据块的差异类型,所述差异类型用于表征所述差异数据块是所述第二文档相对于所述第一文档的修改数据块,增加数据块或者删除数据块;
根据所述位置信息,生成所述第二文档相对于所述第一文档的修改数据块和相同数据块的有序序列,并将所述第二文档相对于所述第一文档的增加数据块和删除数据块,插入到所述有序序列中,得到目标有序序列;
根据所述第二文档相对所述第一文档的每一所述差异数据块在所述目标有序序列中的次序,输出显示每一所述差异数据块的差异描述信息。
可选地,所述根据所述位置信息,生成所述第二文档相对于所述第一文档的修改数据块和相同数据块的有序序列,并将所述第二文档相对于所述第一文档的增加数据块和的删除数据块,插入到所述有序序列中,包括:
对于所述第二文档相对于所述第一文档的每一增加数据块,根据将该增加数据块在所述第二文档中的位置信息,将该增加数据块插入到所述有序序列中的首个在所述第二文档中的位置大于该增加数据块的数据块之前;
对于所述第二文档相对于所述第一文档的每一删除数据块,根据将该删除数据块在所述第一文档中的位置信息,将该删除数据块插入到所述有序序列中的首个在所述第一文档中的位置大于该删除数据块的数据块之前。
可选地,在所述根据所述位置信息,生成所述第二文档相对于所述第一文档的修改数据块和相同数据块的有序序列之前,所述方法还包括:
对所述第二文档相对于所述第一文档的差异数据块进行整合;
获取整合得到的新的数据块的位置信息;
所述根据所述位置信息,生成所述第二文档相对于所述第一文档的修改数据块和相同数据块的有序序列,包括:
根据整合后的所述第二文档中的每一数据块的位置信息,生成所述第二文档相对于所述第一文档的修改数据块和相同数据块的有序序列。
可选地,所述对所述第二文档相对于所述第一文档的差异数据块进行整合,包括:
确定差异类型相同且位置相邻的文本数据块组;
将所述文本数据块组整合为新的文本数据块。
本公开实施例第二方面提供一种文档比较的差异输出装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东软集团股份有限公司,未经东软集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811592905.7/2.html,转载请声明来源钻瓜专利网。