[发明专利]图像识别方法、装置、电子设备和可读介质在审
| 申请号: | 202210393386.1 | 申请日: | 2022-04-14 |
| 公开(公告)号: | CN115131777A | 公开(公告)日: | 2022-09-30 |
| 发明(设计)人: | 郭双双;龚星 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V10/22;G06V10/422;G06V10/80;G06V10/74;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 深圳市联鼎知识产权代理有限公司 44232 | 代理人: | 王晗 |
| 地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 图像 识别 方法 装置 电子设备 可读 介质 | ||
本申请提供一种图像识别方法、装置、电子设备和可读介质。该方法包括:获取包含待识别文本的待识别图像,待识别文本包括多个字符;对待识别图像进行图像识别,得到每个字符的字符位置结果、多个字符的字符连通结果及每个字符的字符识别结果,字符位置结果用于指示字符在待识别图像中的位置,字符连通结果用于指示各个字符与相邻字符之间的邻接关系;根据各个字符的字符位置结果,对待识别图像中的各个字符分别进行字符识别,得到各个字符的字符识别结果;根据字符识别结果和字符连通结果对多个字符进行拼接,得到待识别文本的文本识别结果。该方法能够提升识别结果的准确性。
技术领域
本申请涉及计算机技术领域,尤其涉及一种图像识别方法、装置、电子设备和可读介质。
背景技术
在长途运输过程中,集装箱有可能发生诸如形变、破口、绣破的缺陷,这些缺陷需要被上报以便维修。上报信息时需要上传包含区域位置代码的集装箱图像,以便后续通过区域位置代码来对集装箱进行定位。
在相关技术中,对于上传的集装箱图像,通常采用图像识别模型来检测上传的图像中的区域位置代码,从而自动识别出区域位置代码。
然而,此类方法对图像中区域位置代码的排列方式的变化难以做到准确识别,经常由于区域位置代码的排列方式的变化而出现识别错误,从而影响识别结果的准确性。
发明内容
基于上述技术问题,本申请提供一种图像识别方法、装置、电子设备和可读介质,以使得图像识别过程中,对文本的识别不受到区域位置代码中字符的排列方式的影响,从而提升识别结果的准确性,有利于提升集装箱维修的效率。
本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
根据本申请实施例的一个方面,提供一种图像识别方法,包括:
获取包含待识别文本的待识别图像,所述待识别文本包括多个字符;
对所述待识别图像进行图像识别,得到每个字符的字符位置结果、所述多个字符的字符连通结果及每个字符的字符识别结果,所述字符位置结果用于指示字符在所述待识别图像中的位置,所述字符连通结果用于指示各个字符与相邻字符之间的邻接关系;
根据所述字符识别结果和所述字符连通结果对所述多个字符进行拼接,得到所述待识别文本的文本识别结果。
根据本申请实施例的一个方面,提供一种图像识别装置,包括:
图像获取模块,用于获取包含待识别文本的待识别图像,所述待识别文本包括多个字符;
图像识别模块,用于对所述待识别图像进行图像识别,得到每个字符的字符位置结果、所述多个字符的字符连通结果及每个字符的字符识别结果,所述字符位置结果用于指示字符在所述待识别图像中的位置,所述字符连通结果用于指示各个字符与相邻字符之间的邻接关系;
字符拼接模块,用于根据所述字符识别结果和所述字符连通结果对所述多个字符进行拼接,得到所述待识别文本的文本识别结果。
在本申请的一些实施例中,基于以上技术方案,所述字符位置结果包括各个字符的中心点位置,所述字符连通结果包括用于表示字符之间邻接关系的字符邻接矩阵;图像识别模块包括:
下采样子模块,用于根据多个尺度对所述待识别图像进行下采样,得到所述多个尺度下的图像特征;
特征融合子模块,用于对于所述多个尺度下的图像特征进行特征融合,得到所述多个尺度下的特征融合结果;
位置检测子模块,用于根据所述多个尺度下的特征融合结果检测各个字符的位置,得到各个字符的中心点位置;
邻接分析子模块,用于根据所述多个尺度下的特征融合结果和各个字符的中心点位置分析各个字符的邻接关系,得到各个字符之间的字符邻接矩阵;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210393386.1/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





