[发明专利]用于识别图像中的字符的方法、装置、设备和介质有效
申请号: | 201910291030.5 | 申请日: | 2019-04-11 |
公开(公告)号: | CN110135427B | 公开(公告)日: | 2021-07-27 |
发明(设计)人: | 郭贺;钦夏孟;韩钧宇;朱胜贤 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/46;G06K9/62 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 李辉;罗利娜 |
地址: | 100094 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 识别 图像 中的 字符 方法 装置 设备 介质 | ||
根据本公开的实施例,提供了用于识别图像中的字符的方法、装置、设备和介质。一种识别图像中的字符的方法包括:提取图像的特征表示;通过对特征表示应用注意力机制来确定针对多个字符识别模型的相应的多个注意力特征表示,多个字符识别模型分别被配置用于识别多个类型的字符;以及利用多个字符识别模型来分别处理多个注意力特征表示,以识别图像中与多个类型相关的字符。以此方式,可以更直接、准确且快速地识别出图像中期望的字符。
技术领域
本公开的实施例主要涉及图像处理领域,并且更具体地,涉及用于识别图像中的字符的方法、装置、设备和计算机可读存储介质。
背景技术
学字符识别(OCR)是将图像中呈现的字符识别为计算机中可读字符的过程。OCR具有广泛的应用,一些示例应用包括网络图片文字识别、卡证识别(例如身份证、银行卡、名片识别等)、票据识别(例如增值税发票、行程单、火车票、出租车票识别等)、车牌识别等等。在一些应用中,通常需要识别图像中的若干有用字符,摈弃其他无关字符。传统的OCR技术存在流程复杂、识别准确度不高等问题。因此,期望能够以有效方式实现更准确的字符识别。
发明内容
根据本公开的示例实施例,提供了用于识别图像中的字符的方案。
在本公开的第一方面中,提供了一种识别图像中的字符的方法。该方法包括提取图像的特征表示;通过对特征表示应用注意力机制来确定针对多个字符识别模型的相应的多个注意力特征表示,多个字符识别模型分别被配置用于识别多个类型的字符;以及利用多个字符识别模型来分别处理多个注意力特征表示,以识别图像中与多个类型相关的字符。
在本公开的第二方面中,提供了一种用于识别图像中的字符的装置。该装置包括特征提取模块,被配置为提取所述图像的特征表示;注意力机制模块,被配置为通过对所述特征表示应用注意力机制来确定针对多个字符识别模型的相应的多个注意力特征表示,所述多个字符识别模型分别被配置用于识别多个类型的字符;以及字符识别模块,被配置为利用所述多个字符识别模型来分别处理所述多个注意力特征表示,以识别所述图像中与所述多个类型相关的字符。
在本公开的第三方面中,提供了一种电子设备,包括一个或多个处理器;以及存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现根据本公开的第一方面的方法。
在本公开的第四方面中,提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现根据本公开的第一方面的方法。
应当理解,发明内容部分中所描述的内容并非旨在限定本公开的实施例的关键或重要特征,亦非用于限制本公开的范围。本公开的其它特征将通过以下的描述变得容易理解。
附图说明
结合附图并参考以下详细说明,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标注表示相同或相似的元素,其中:
图1示出了本公开的多个实施例能够在其中实现的环境的示意图;
图2示出了根据本公开的一些实施例的用于识别图像中的字符的系统的示意框图;
图3示出了根据本公开的一些实施例的图2的字符识别模型和注意力机制部分的示例结构的示意框图;
图4示出了根据本公开的一些实施例的在训练阶段中图2的系统的示意框图;
图5示出了根据本公开的一些实施例的识别图像中的字符的方法的流程图;
图6示出了根据本公开的实施例的用于识别图像中的字符的装置的示意框图;以及
图7示出了能够实施本公开的多个实施例的计算设备的框图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910291030.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:样本标注方法及计算机存储介质
- 下一篇:图像分割处理方法和装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序