[发明专利]一种用于进行文档文件处理的方法及装置有效
申请号: | 201310282405.4 | 申请日: | 2013-07-05 |
公开(公告)号: | CN103488619A | 公开(公告)日: | 2014-01-01 |
发明(设计)人: | 徐广金 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F17/24 | 分类号: | G06F17/24 |
代理公司: | 北京汉昊知识产权代理事务所(普通合伙) 11370 | 代理人: | 罗朋 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 进行 文档 文件 处理 方法 装置 | ||
技术领域
本发明涉及文档文件处理技术,尤其涉及一种用于进行文档文件处理的方法及装置。
背景技术
目前用户使用移动设备阅读文档文件已经非常普遍,对于不同格式的文档文件,需要在计算机中安装支持相应格式的文档文件编辑软件或文档文件阅读软件才能呈现文档文件,也即,文档文件图像根据文档文件中的文档文件元素的呈现属性来对各个文档文件元素进行渲染,从而呈现该文档文件,其中呈现属性包括但不限于文档文件元素在文档文件中的坐标信息、样式信息,该样式信息包括文字字体、文字大小及颜色等。而如果不安装适应各种文档文件格式的不同文档文件编辑软件或文档阅读软件,因为现有技术中的移动设备只能对文档文件结构简单的,并且由人工编辑过的特定格式的文档文件完成自适应屏幕的处理,对于当前最普遍应用的微软office系列格式、PDF、openOffice系列格式的文档文件,不能批量处理为可以自适应用户设备屏幕的文档文件,不能满足当前广泛阅读电子文档文件的需求,也给用户阅读带来很大的不便,降低阅读体验。
发明内容
本发明所要解决的技术问题是提供一种用于进行文档文件处理的方法及装置,以解决现有技术中不能将大多数格式的文档文件批量处理为可以自适应用户设备屏幕的文档文件的问题。
根据本发明的一个方面,提供一种用于进行文档文件处理的方法,包括:
从文档文件中提取文档文件元素;
根据所述文档文件元素的类型与文档文件元素在该文档文件中的位置信息来对所述文档文件元素进行合并,以生成合并后的文档文件。
根据本发明的另一个方面,还提供了一种用于进行文档文件处理的文档文件处理装置,包括:
元素提取装置,用于从文档文件中提取文档文件元素;
合并装置,用于根据所述文档文件元素的类型与文档文件元素在该文档文件中的位置信息来对所述文档文件元素进行合并,以生成合并后的文档文件。
本发明通过根据从文档文件中提取的文档文件元素的类型,与该文档文件元素在文档文件中的位置信息,来对文档文件元素进行合并,生成合并后的文档文件,不需要人工参与分别对每篇文档文件进行编辑,就可以生成自适应用户设备的屏幕的文档文件。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1为本发明的一种用于文档文件处理的方法实施例的流程图;
图2a-2c为本发明实施例中坐标相邻的两个图形的示意图;
图3为本发明的一种用于文档文件处理的装置实施例的示意图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
下面结合附图对本发明作进一步详细描述。
本文中:
“文档文件”指采用文档文件编辑软件进行编辑生成的文件,其中包含文字、图形等文档文件元素,具体地,文档文件包括但不限于 Word、Excel、PDF、OpenOffice、RTF、XML、TXT、EPUB等格式的文档文件;
“文档文件元素”指在文档文件中的元素,包含但不限于文字、图形。
图1示出了本发明一个实施例的对文档文件进行处理的方法的流程示意图。
如图1所示,在步骤S101中,从文档文件中提取文档文件元素,文档文件元素包括但不限于至少以下任一种形式:文字、图形。
在步骤S102中,根据文档文件元素的类型与文档文件元素在该文档文件中的位置信息来对所述文档文件元素进行合并,以生成合并后的文档文件。
具体的,可以基于以下至少一种方式,来根据文档文件元素的类型与位置信息将多个文档文件元素进行合并:
i)当文档文件元素为文字时,根据文字的排列方式及坐标信息将所述文字合并处理为一个文字序列。
可以理解,常见的文字排列方式包括横排和竖排,当文字的排列方式为横排时,可以根据文字的坐标信息,将相邻换行符之间的同一行,但被诸如图形的其他文档文件元素分隔开的,多段横排文字合并成一个按横排方式连续排列的文字序列;当文字的排列方式为竖排时,可以根据文字的坐标信息,将相邻换行符之间的同一列,但被诸如图形的其他文档文件元素分隔开的,多段竖排文字合并处理成一个按竖排方式一连续排列的文字序列。
ii)对于相邻的两个图形,根据两个图形的坐标信息,将两个图形合并为一个图形。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310282405.4/2.html,转载请声明来源钻瓜专利网。