[发明专利]用于文件比较的内容对齐方法、装置、存储介质和设备有效
申请号: | 201811368186.0 | 申请日: | 2018-11-16 |
公开(公告)号: | CN109684437B | 公开(公告)日: | 2020-10-30 |
发明(设计)人: | 韩志刚;宋洋;于广伟;姜楠 | 申请(专利权)人: | 东软集团股份有限公司 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/16;G06F40/194 |
代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙) 11447 | 代理人: | 李鹏;魏嘉熹 |
地址: | 110179 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 文件 比较 内容 对齐 方法 装置 存储 介质 设备 | ||
本公开涉及一种用于文件比较的内容对齐方法、装置、存储介质和设备,该方法包括:在第一文件和第二文件中以每个预设单位的内容作为一个元素,对第一文件和第二文件进行对比,以获取第一文件与第二文件的第一最大公共子序列;根据第一最大公共子序列,确定第一文件中的共通元素和删除元素,以及第二文件中的共通元素和添加元素;通过将第一文件中的共通元素与第二文件中的共通元素建立索引对应关系进行对齐;根据删除元素所在的共通元素间隙与添加元素所在的共通元素间隙的位置对应关系,对第一文件中的删除元素与第二文件中的添加元素进行标记处理。能够不依赖于复杂算法实现文件之间的对比和内容对齐,能够降低实现难度,易于实现。
技术领域
本公开涉及文本处理技术领域,具体地,涉及一种用于文件比较的内容对齐方法、装置、存储介质和设备。
背景技术
在日常应用中,文件/文本的比较在很多领域都是一个比较常见的需求。例如对比两个文件中的两篇文章(例如对比两个word文件),或者对比两个文件中的代码(例如两个脚本中的代码差异)等等。进行文件比对的目的通常是为了实现两个文件的行或段落的对齐,从而找到内容相关性和差异。
由于通过文件对比能够帮助用户快速地找到两个文件中的相关性和差异,因此无论是对于个人还是多人协作,文件对比都是日常应用中的一个重要功能,能够提高用户的工作效率。例如在目前的软件开发中,基本都是由多人协作开发完成,因此对于其他人修改的文件,通过文件比较可以快速地找到相同的内容,并定位差异的位置,从而方便协作人员进行后续处理,降低开发人员的工作量。
目前,现有的通过进行文件对比将文件中的行或段落对齐的实现方法通常是基于比较复杂的算法实现,实现难度大。
发明内容
本公开的目的是提供一种用于文件比较的内容对齐方法、装置、存储介质和设备,用于解决现有的文件内容对齐方法的算法复杂,实现难度大的问题。
为了实现上述目的,本公开的第一方面,提供一种用于文件比较的内容对齐方法,所述方法包括:
在第一文件和第二文件中以每个预设单位的内容作为一个元素,对所述第一文件和所述第二文件进行对比,以获取第一文件与第二文件的第一最大公共子序列,所述第一最大公共子序列为所述第一文件和所述第二文件中的元素排列顺序一致的最大公共部分;
根据所述第一最大公共子序列,确定所述第一文件中的共通元素和删除元素,以及所述第二文件中的共通元素和添加元素,所述删除元素为所述第一文件中除所述共通元素之外的其他元素,所述添加元素为所述第二文件中除所述共通元素之外的其他元素;
通过将所述第一文件中的共通元素与所述第二文件中的共通元素建立索引对应关系,将所述第一文件中的共通元素与所述第二文件中的共通元素进行对齐;
根据所述第一文件中的删除元素所在的共通元素间隙与所述第二文件中的添加元素所在的共通元素间隙的位置对应关系,对所述第一文件中的删除元素与所述第二文件中的添加元素进行标记处理。
可选地,所述通过将所述第一文件中的共通元素与所述第二文件中的共通元素建立索引对应关系,将所述第一文件中的共通元素与所述第二文件中的共通元素进行对齐,包括:
获取所述第一文件中的共通元素中的每个元素的索引号,以及所述第二文件中的共通元素中的每个元素的索引号;
依次将所述第一文件中的共通元素中的每个元素的索引号与所述第二文件中的共通元素中的对应元素的索引号进行关联,以建立所述索引对应关系,以将所述第一文件中的共通元素与所述第二文件中的共通元素进行对齐。
可选地,所述根据所述第一文件中的删除元素所在的共通元素间隙与所述第二文件中的添加元素所在的共通元素间隙的位置对应关系,对所述第一文件中的删除元素与所述第二文件中的添加元素进行标记处理,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东软集团股份有限公司,未经东软集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811368186.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种知识的关联方法及应用
- 下一篇:一种具有父子层级结构检索数据的方法
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法