[发明专利]文本检测方法和装置以及文本识别系统有效
申请号: | 201610319960.3 | 申请日: | 2016-05-13 |
公开(公告)号: | CN107368830B | 公开(公告)日: | 2021-11-09 |
发明(设计)人: | 马彬 | 申请(专利权)人: | 佳能株式会社 |
主分类号: | G06K9/32 | 分类号: | G06K9/32 |
代理公司: | 北京怡丰知识产权代理有限公司 11293 | 代理人: | 迟军 |
地址: | 日本东京都*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 检测 方法 装置 以及 识别 系统 | ||
本发明提供一种文本检测方法和装置以及文本识别系统。本发明的一个方面公开了一种文本检测方法。该文本检测方法包括:获得获取的图像中的文本组件;基于特征相似性测度,获得针对各个文本组件的连接候选;基于该文本组件的连接候选的方向分布,计算针对各个文本组件的主方向;基于种子文本组件的主方向,由所述文本组件来确定至少一个种子文本组件;通过基于所述文本组件的主方向,将对应的文本组件附加到所述种子文本组件,来生成至少一个文本组件组;以及基于所述文本组件组,生成所获取的图像中的文本区域。根据本发明,将提高文本检测的精确度。
技术领域
本发明涉及图像处理,尤其涉及例如文本检测方法和装置以及文本识别系统。
背景技术
自然场景图像和视频帧中的文本(例如布告牌中的文本、海报中的文本)通常携带用于视觉内容理解应用(诸如智能翻译、人机交互等等)的重要信息。文本检测技术是用于视觉内容理解应用的关键技术。然而,因为自然场景图像中的文本几乎没有任何固定的布局模式,所以在自然场景图像中的文本的布局复杂(例如在自然场景图像中,文本具有任意或多个方向)的情况下,容易得到错误的文本检测结果(即,属于不同文本的文本组件(component)将容易被检测为属于一个相同文本)。在“Robust Text Detection inNatural Scene Images”(Yin,X.-C.;Yin,X.;Huang,K.Hao,H.-W.,IEEE Transactionson Pattern Analysis and Machine Intelligence,2013,36,970-983)(下文中简称为文档1)以及中国专利申请CN201210506072.4(下文中简称为文档2)中,公开了为解决上述多方向文本检测问题的两个示例性技术。
文档1和文档2中公开的主要操作包括:首先,通过使用两个或三个种子文本组件,初始化文本组件组,其中,基于文本组件之间的特征相似性测度(例如空间距离)和/或线性对准关系,来确定种子文本组件;第二,针对不在当前文本组件组内的一个文本组件,基于该文本组件与当前文本组件组中的末端文本组件之间的特征相似性测度,并且基于当前文本组件组的方向(例如当前文本组件组中的最后两个末端文本组件之间的连接的扩展方向,或者当前文本组件组内的文本组件之间的连接的平均方向),来判断是否将该文本组件附加到当前文本组件组;第三,重复上述两个操作,直到所有的文本组件被处理。然后,最终获得的文本组件组将被用来生成对应的文本区域。
如上所述,首先将由所确定的种子文本组件来初始化文本组件组,然后将通过附加满足预定义的条件的其他对应的文本组件,来扩大文本组件组。因此,是否能够正确地确定种子文本组件,将直接影响文本检测结果。如文档1中所公开的,在两个文本组件之间的空间距离为最小的情况下,这两个文本组件将被确定为种子文本组件。如文档2中所公开的,在三个文本组件之间的空间距离满足空间距离限制,并且这三个文本组件满足线性对准关系的情况下,这三个文本组件将被确定为种子文本组件。然而,在某些情形中,与属于一个相同文本的文本组件相比,属于两个不同文本的两个文本组件可以具有最小的空间距离,例如如图1A所示的虚线框中的两个文本组件“禁”和“喫”。在某些情形中,例如文本被紧密布置,可能存在满足线性对准关系和空间距离限制的三个文本组件,例如图1B中所示的虚线框中的三个文本组件“江”、“禁”和“上”。因此,这些文本组件将被视为属于一个相同文本,并且将被错误地确定为种子文本组件。因此,最终的文本检测结果将是错误的。
发明内容
因此,鉴于上述背景技术中的陈述,本公开的目的是解决上述问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佳能株式会社,未经佳能株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610319960.3/2.html,转载请声明来源钻瓜专利网。