[发明专利]一种电子文档中的空白区域处理方法和系统有效

专利信息
申请号: 201510696600.0 申请日: 2015-10-23
公开(公告)号: CN105373526B 公开(公告)日: 2019-02-15
发明(设计)人: 时志芳;贾丽 申请(专利权)人: 北大方正集团有限公司;北京方正阿帕比技术有限公司
主分类号: G06F17/25 分类号: G06F17/25
代理公司: 北京三聚阳光知识产权代理有限公司 11250 代理人: 李敏
地址: 100871 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 电子 文档 中的 空白 区域 处理 方法 系统
【说明书】:

本实施例中的电子文档中的空白区域处理方法,首先,提取文档中的空白行;然后,根据所述空白行获取空白区域的高度;再根据所述空白区域的高度,确定是否需要处理;最后,将需要处理的空白区域内的空白行进行合并。该方案采用一种特定的白页过滤方法,既减少了用户的多余操作,又在最大程度上保留了文档原有的正常的排版间隔信息,可以有效的减少文档中的空白区域,通过选择合理的条件,将空白区域的范围尽量缩小,保证文档显示时的紧凑型,提高终端设备的屏幕的利用率,降低用户不必要的翻页操作,提高用户体验。

技术领域

发明涉及一种电数据加工领域,具体地说是一种电子文档中的空白区域处理方法和系统。

背景技术

随着数字信息的发展,电子文档已经成为人们获取信息的途径之一。电子文档可以通过移动设备如手机、计算机、平板电脑、电子书等设备进行阅读。电子文档的形式也是多样的,如PDF文档,EPub文档等。PDF文档是一种常用的电子文档的格式,但是PDF格式的文档无法编辑。EPub文档内部使用了XHTML或DTBook来展现文字、并以zip压缩格式来存储文档内容,ePub作为一种常用的电子图书标准被广泛使用,一个EPUB文档就是一个简单ZIP格式文件,其中包括按照预先定义的方式排列的文件,使得其文字内容可以根据阅读设备的特性,以最适于阅读的方式显示。

在阅读电子文档时,由于文档以及显示设备的原因,电子文档有时会显示出多余的空白位置。例如,在移动终端阅读ePub文档时,可能由于ePub本身的结构问题而显示出一些多余的空白页或者单页内出现大面积的空白区域,这样就需要用于进行一些多余的翻页操作进行阅读,不仅降低了用户的阅读体验,而且对于屏幕有限的移动设备终端来说,显得排版不够紧凑,版面利用率低。

对于EPUB阅读中的白页问题,现有技术中一种方式是对空白页不做任何处理,保留原有的结构,这样会给用户的使用带来不便;另一种方式是将文档中的所有空白区域全部删除,但是,这种做法可能会丢失文档结构中正常的排版间隔信息,不利于文档的正常显示。

如现有技术中公开了一种排版方法和装置,首先将文件分页,当分页后的页面存在空白区域时,确定文件中导致空白区域的可调整元素,调整所述可调整元素与相邻元素在文件中的排版顺序,将空白区域减小时的排版顺序确定为最终的排版顺序。但是,方案中需要人工方式来获取可调元素,如果元素的调整影响表述效果,则无法进行调整。此外,对于由于换行、多余空白行造成的空白区域,该方案只能通过元素调换的方式调整到其他位置,无法减少多余空白行导致的空白区域。

发明内容

为此,本发明所要解决的技术问题在于现有技术中无法在不影响文档内容表达的同时减少多余的空白区域,从而提出一种电子文档中的空白区域处理方法和系统。

为解决上述技术问题,本发明提供一种电子文档中的空白区域处理方法,其特征在于,包括如下过程:

提取文档中的空白行;

根据所述空白行获取空白区域的高度;

根据所述空白区域的高度,确定是否需要处理;

将需要处理的空白区域内的空白行进行合并。

优选地,所述提取文档中的空白行的过程,包括:

获取文档的章节文件和目录文件;

根据目录文件确定所述章节文件的遍历顺序;

依次检测每个章节文件的段落标签,获取空白行的标签。

优选地,所述空白行的标签至少包括段落标签值为空格的标签或段落标签纸为换行的标签。

优选地,根据所述空白行获取空白区域的高度的过程,包括

获取空白行所在段落标签对应的样式属性文件内描述的行高和行间距;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北大方正集团有限公司;北京方正阿帕比技术有限公司,未经北大方正集团有限公司;北京方正阿帕比技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510696600.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top