[发明专利]版式文档中复合图的逻辑处理装置和逻辑处理方法有效
申请号: | 201310172879.3 | 申请日: | 2013-05-10 |
公开(公告)号: | CN104142961B | 公开(公告)日: | 2017-08-25 |
发明(设计)人: | 许灿辉;汤帜;陶欣;史操 | 申请(专利权)人: | 北大方正集团有限公司;北京方正阿帕比技术有限公司;北京大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/22 |
代理公司: | 北京友联知识产权代理事务所(普通合伙)11343 | 代理人: | 尚志峰,汪海屏 |
地址: | 100871 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种版式文档中复合图的逻辑处理装置,包括复合图区块提取单元,用于提取所述版式文档中的复合图区块;文档解析单元,用于对所述版式文档进行解析,以获取其中包含的文字图元;图注图元提取单元,用于从所述文字图元中提取出图注图元;关联检测单元,用于检测所述复合图区块与所述图注图元之间的关联关系;关系存储单元,用于存储检测到的所述关联关系。本发明还提出了一种版式文档中复合图的逻辑处理方法。通过本发明的技术方案,可以对从版式文档中分割出来的复合图进行妥善的逻辑处理,从而便于实现对版式文档中图文混排版面的复合图进行版面理解,避免逻辑错误。 | ||
搜索关键词: | 版式 文档 复合 逻辑 处理 装置 方法 | ||
【主权项】:
一种版式文档中复合图的逻辑处理装置,其特征在于,包括:复合图区块提取单元,用于提取所述版式文档中的复合图区块;文档解析单元,用于对所述版式文档进行解析,以获取其中包含的文字图元;图注图元提取单元,用于从所述文字图元中提取出图注图元;关联检测单元,用于检测所述复合图区块与所述图注图元之间的关联关系;关系存储单元,用于存储检测到的所述关联关系;信息获取单元,用于获取所述复合图区块的特征属性信息;元素分类单元,用于根据所述特征属性信息,对所述复合图区块中包含的元素进行分类;复合图处理单元,用于根据分类结果,保留所述复合图区块中的正文插图复合图,并过滤其他元素,以供所述关联检测单元检测所述正文插图复合图与所述图注图元之间的关联关系;所述关联检测单元包括:数量判断子单元,用于判断所述复合图区块中包含的正文插图复合图的数量;距离分析子单元,用于在所述复合图区块中仅包含一个正文插图复合图的情况下,选取与该正文插图复合图的距离小于预设距离的图注图元,以作为与该正文插图复合图相关联的图注图元;二分图分析子单元,用于在所述复合图区块中包含多个正文插图复合图的情况下,将所述多个正文插图复合图和解析出的所有图注图元分别作为二分图的顶点,以利用所述二分图判断所述多个正文插图复合图与所述图注图元之间的关联关系。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北大方正集团有限公司;北京方正阿帕比技术有限公司;北京大学,未经北大方正集团有限公司;北京方正阿帕比技术有限公司;北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310172879.3/,转载请声明来源钻瓜专利网。