[发明专利]版式电子文档的页眉页脚识别方法及装置在审
申请号: | 201410117009.0 | 申请日: | 2014-03-26 |
公开(公告)号: | CN104951429A | 公开(公告)日: | 2015-09-30 |
发明(设计)人: | 吴运俊 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06K9/20 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苏培华 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请公开了版式电子文档的页眉页脚识别方法及装置,其中所述方法包括:分别对版式电子文档的多个页进行解析,获取各个页内包含的各个文本行的文本内容;遍历各个页内的各个文本行的文本内容,判断各个文本行是否满足页眉页脚的特征;根据判断结果确定页眉页脚所在的文本行。通过本申请,可以结合多页内容在某一行上的相似性,和基于这种相似性出来的页面反推识别文档中的某一行是否是页眉页脚,这种方法对于页眉页脚的特征值和位置没有单纯的定义,对于目前文档的覆盖率大大增加,具有很高的识别准确率。 | ||
搜索关键词: | 版式 电子 文档 页眉 识别 方法 装置 | ||
【主权项】:
一种版式电子文档的页眉页脚识别方法,其特征在于,包括:分别对版式电子文档的多个页进行解析,获取各个页内包含的各个文本行的文本内容;遍历各个页内的各个文本行的文本内容,判断各个文本行是否满足页眉页脚的特征;根据判断结果确定页眉页脚所在的文本行。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410117009.0/,转载请声明来源钻瓜专利网。
- 上一篇:一种搜索方法及装置
- 下一篇:一种实现服务器显示管理的系统及方法