[发明专利]字符串提取方法以及字符串提取装置有效
申请号: | 201180069000.1 | 申请日: | 2011-03-04 |
公开(公告)号: | CN103460222B | 公开(公告)日: | 2017-07-07 |
发明(设计)人: | 后藤雅典;米泽亨;黑岩素子 | 申请(专利权)人: | 光荣株式会社 |
主分类号: | G06K9/20 | 分类号: | G06K9/20 |
代理公司: | 北京市柳沈律师事务所11105 | 代理人: | 胡金珑 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字符串 方法 以及 装置 | ||
技术领域
本发明涉及从拍摄了纸张类的纸张类图像中切出字符串而进行字符识别时的字符串切出方法以及字符串切出装置。
背景技术
在纸币、支票、票据或商品券等的纸张类中,作为识别号而印刷有用于确定该纸张类的字符串。在纸币的情况下,该识别号被称为序列号。例如,在发现了伪造纸币的情况下,能够利用该序列号来确认该伪造纸币是否为自行交易的纸币。因此,在金融机构等中,存在想要对该序列号自动地进行字符识别并注册在数据库中,对交易的纸币进行管理的要求。
为了利用纸币的序列号而构筑数据库,需要对作为数据而注册的序列号准确地进行字符识别,但该字符识别是从拍摄了纸币的纸币图像中切出序列号图像而进行。因此,需要确定作为序列号的字符串的位置而准确地切出图像。作为用于切出图像上的字符串的技术,例如在专利文献1中,公开了基于颜色信息而区分背景和字符串,仅切出字符串的图像的方法。具体而言是如下方法:利用彩色的纸币图像,通过从包含字符串的区域的图像中去掉表示背景的颜色的像素而仅切出字符串的图像。
此外,在专利文献2中,公开了利用在字符和背景中浓度不同的情况而切出字符串的图像的方法。具体而言是如下方法:通过包含字符串的区域,生成投射了图像的浓度的直方图,并将浓度投射值超过预定阈值的区域作为字符串图像而切出。通过调整阈值,使得切出的区域的宽度与预先设定的字符串图像的宽度在容许范围内一致,能够从背景或污渍中分离序列号图像而切出。
此外,在专利文献3中,公开了通过字符切出窗口在字符串上进行扫描而检测各字符的位置,从而一个字符一个字符地切出形成字符串的各字符的方法。具体而言是如下方法:利用字符切出窗口,该字符切出窗口由与在形成字符串的字符中大小最小的字符匹配而设置的中心区域、在中心区域的外侧与最大的字符匹配而设置的带状的外接区域、在外接区域的外侧基于各字符间的间隔而设置的带状的背景区域构成。通过在被2值化的字符串图像上移动字符切出窗口,当在背景区域以及外接区域中形成区域内的字符的像素的合计面积满足预定条件且在中心区域中字符的投射长度满足预定值的情况下,将该位置检测作为字符位置而切出字符图像。
现有技术文献
专利文献
专利文献1:特开2010-225013号公报
专利文献2:特开平6-301814号公报
专利文献3:特公平7-99532号公报
发明内容
发明要解决的课题
但是,在利用颜色信息的专利文献1的方法中,存在在印刷的字符串和背景为同色系的情况下不能区分背景和字符串的情况。纸币根据发行国或现金种类而具有各种大小、颜色、花纹等,但也有序列号以与背景相同的色系而被印刷的情况,不能应对这样的情况。
此外,在利用表示了字符串的浓度的直方图的专利文献2的方法中,存在若在字符串附近印刷了字符识别对象外的字符或者在字符串的背景中有图案或花纹,则不能准确地切出字符串的情况。存在在纸币上除了序列号以外还印刷了与发行国有关的信息或金额等的信息的情况。此外,也存在在序列号的背景中描画了图案或花纹的情况。若存在序列号以外的字符或背景的花纹,则因直方图的值变化,所以对序列号的切出处理产生影响。
具体而言,例如图20(A)所示,若在表示序列号区域101的Y方向的浓度分布的直方图中切出超过图示的阈值h的区域,则成为仅切出在序列号102的上部印刷的切出对象外的字符串103的图像。此外,即使将阈值降低为包含序列号102,通过切出包含对象外字符串103和序列号102两者的图像区域,也不能切出仅包含序列号102的图像。其结果,存在即使在切出的区域中进行字符识别也不能对序列号102准确地进行字符识别的情况。另外,也有缩小作为序列号区域101的区域的Y方向的高度,使得对象外的字符串103不包含在区域101内的方法,但存在因在序列号102的印刷位置上存在误差,所以不能缩小的情况。此外,如图20(B)所示,在序列号102的背景中描画了花纹的情况下,受到背景的影响。即使在表示序列号区域101的X方向的浓度分布的直方图中切出超过图示的阈值h的区域,也不能准确地确定形成序列号102的各字符的位置。
此外,在利用相当于一个字符量的大小的字符切出窗口的专利文献3的方法中,如图20(B)所示的情况下,也因字符和背景的浓度差小所以不能准确地检测各字符的位置,不能切出各字符。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于光荣株式会社,未经光荣株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201180069000.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于广播网络的多路光纤自动备份装置
- 下一篇:一种鉴频鉴相器