[发明专利]用于从文档图象抽取标题的标题抽取装置及其方法无效

专利信息
申请号: 01135946.3 申请日: 1996-09-04
公开(公告)号: CN1365080A 公开(公告)日: 2002-08-21
发明(设计)人: 胜山裕;直井聪 申请(专利权)人: 富士通株式会社
主分类号: G06K9/20 分类号: G06K9/20;G06K9/34;G06T3/40;G06T11/60;H04N1/387
代理公司: 中国国际贸易促进委员会专利商标事务所 代理人: 吴丽丽
地址: 日本*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 文档 图象 抽取 标题 装置 及其 方法
【权利要求书】:

1.一种用于从已经转换为图象数据的文档的文档图象抽取所需的局部区域并用于作出识别的标题抽取装置,包括:

字符区域产生装置,用于产生包含由文档图象连接的黑色象素所组成的黑色象素连接区域的字符区域;

字符串区域产生装置,用于一致化由所述字符区域产生装置所产生的一个或者多个字符区域,并用于产生包含一个或者多个字符区域的字符串区域;以及

标题抽取装置,用于抽取包含具有预定规格的黑色象素连接区域的表区域并从该表区域中的多个字符串区域抽取一个特定的字符串区域作为一个标题区域。

2.如同权利要求1中所述的标题抽取装置,

其中所述标题抽取装置适于在定界线的位置划分一个具有定界线的第五字符串区域。

3.如同权利要求2中所述的标题抽取装置,

其中所述标题抽取装置适于判定黑色象素是否分布在第五字符串区域中的多个字符区域中并在黑色象素的位置划分第五字符串区域。

4.如同权利要求2中所述的标题抽取装置,

其中所述标题抽取装置适于判定第五字符串区域的多个字符区域与由所述字符区域产生装置对于作为目标的第五字符串区域所获得的字符区域之间的差,并在检测到差的位置划分第五字符串区域。

5.如同权利要求1中所述的标题抽取装置,

其中所述标题抽取装置适于判定定界线是否排布在表区域中的一个第六字符串区域的邻域中的一个特定的区域中,并在定界线没有排布在该特定区域中时将第六字符串区域作为一个表外字符串区域处理。

6.如同权利要求5中所述的标题抽取装置,

其中所述标题抽取装置适于对应于表区域中的字符串区域的相互位置关系作为第六字符串区域处理在其上没有排布一个表内字符串区域的一个字符串区域,搜索第六字符串区域上方排布的特定区域中的黑色象素,并在检测到超过预定阈值的黑色象素时判定定界线排布在该特定区域中。

7.如同权利要求6中所述的标题抽取装置,

其中所述标题抽取装置适于把第六字符串区域与第六字符串区域或者表区域以上的另外一个字符串区域之间的一个区域作为特定的区域处理,并指定对应于第六字符串区域与另外一个字符串区域或者表区域的位置关系的阈值。

8.如同权利要求1中所述的标题抽取装置,

其中所述标题抽取装置适于按照接近于表区域的左上边缘的位置的顺序而输出字符串区域。

9.如同权利要求8中所述的标题抽取装置,

其中所述字符串区域产生装置适于产生一个或者多个包含字符区域的字符串矩形作为字符串区域,以及

其中所述标题抽取装置适于对应于字符串矩形的特定的顶点坐标数值向表区域中的多个字符串矩形指定优先顺序。

10.如同权利要求1中所述的标题抽取装置,

其中所述标题抽取装置适于向象是作为条目区域的条目以及象是作为标题区域的标题的字符串区域指定优先顺序,并输出条目区域及标题区域。

11.如同权利要求10中所述的标题抽取装置,

其中所述标题抽取装置适于对应于预定的条目关系、标题的位置、以及字符数获得字符串区域对,并按较高位置的顺序输出字符串区域对。

12.如同权利要求10中所述的标题抽取装置,

其中所述标题抽取装置适于输出其字符数等于或者大于预定阈值的一个第七字符串区域作为条目区域。

13.如同权利要求12中所述的标题抽取装置,

其中所述标题抽取装置适于输出排布在第七字符串区域右方的字符串区域作为标题区域。

14.如同权利要求10中所述的标题抽取装置,

其中所述标题抽取装置适于输出其字符数小于预定阈值的第八字符串区域作为条目区域,并输出其字符数等于或者大于阈值排布在该第八字符串区域右边的字符串区域作为标题区域。

15.一种标题抽取方法,包括步骤:

转换文档为图象数据并产生一个文档图象;

产生包含由文档图象中连接的黑色象素所组成的黑色象素连接区域的字符区域;

一致化一个或者多个的字符区域并产生包含这些字符区域的字符串区域;

抽取包含具有预定规格的黑色象素连接区域的一个表区域;

抽取表区域中的多个字符串区域的一个特定的字符串区域作为标题区域,以及

识别标题区域中的字符。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/01135946.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top