[发明专利]关键字识别方法和装置有效

专利信息
申请号: 200810091299.0 申请日: 2008-04-28
公开(公告)号: CN101571921A 公开(公告)日: 2009-11-04
发明(设计)人: 孙俊;藤井勇作;武部浩明;藤本克仁;直井聪 申请(专利权)人: 富士通株式会社
主分类号: G06K9/20 分类号: G06K9/20
代理公司: 北京三友知识产权代理有限公司 代理人: 黄纶伟
地址: 日本神奈*** 国省代码: 日本;JP
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种关键词识别方法和装置。其对多幅包含共有关键词的图案或文档中包含的共有关键词进行识别,首先根据包含共有关键词的区域的灰度值生成二值前景累积图,并确定可能的关键字分割段,识别出对应于每个可能的关键字分割段的识别字符,利用标准关键词中包含的关键字构成的关键字组合对与上述识别字符构成的关键字匹配对的对应关系、估计关键词中心的位置,利用对应于上述关键词中心的关键字匹配对生成一个图,利用图中的最大完全子图确定识别字符中正确的关键字,并识别出遗漏关键字和粘连关键字,判定上述共有关键词中包含了具有最大识别比例的关键词。
搜索关键词: 关键字 识别 方法 装置
【主权项】:
1、一种从包含共有关键词的多幅图像或文档中识别共有关键词的关键词识别方法,该方法包括:根据上述多幅图像或文档中包含共有关键词的区域的灰度值生成二值前景累积图;根据上述二值前景累积图确定其分割点,并确定可能的关键字分割段;对所有可能的关键字分割段中的对象进行字符识别,得到对应于所有可能的关键字分割段的识别字符;针对标准关键词字典中包含的至少一个标准关键词中的各个标准关键词,执行下列步骤:利用关键字组合对和与之对应的关键字匹配对的对应关系、估计共有关键词中心的位置,所述关键字匹配对是由各个标准关键词中包含的关键字构成的,所述关键字匹配对是由上述识别字符中包含的、与上述关键字组合对的字符相同的字符构成的;将对应于估计出的关键词中心位置的多个关键字匹配对中包含的识别字符作为一个图的顶点,生成一个图,并利用包含的两两均连通的顶点个数最多的、所述图中的最大完全子图来确定正确的关键字;基于上述估计出的关键词中心位置和正确的关键字以及所述各个标准关键词,确定遗漏关键字;基于上述估计出的关键词中心位置、正确的关键字、确定的遗漏关键字以及所述各个标准关键词,识别粘连关键字;根据针对所述各个标准关键词识别出的所述正确的关键字、所述确定的遗漏关键字和粘连关键字,判定所述共有关键词包含哪一个标准关键词。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/200810091299.0/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top