[发明专利]图像识别方法、装置、电子设备和可读介质在审
申请号: | 202210393386.1 | 申请日: | 2022-04-14 |
公开(公告)号: | CN115131777A | 公开(公告)日: | 2022-09-30 |
发明(设计)人: | 郭双双;龚星 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V10/22;G06V10/422;G06V10/80;G06V10/74;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 深圳市联鼎知识产权代理有限公司 44232 | 代理人: | 王晗 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 识别 方法 装置 电子设备 可读 介质 | ||
1.一种图像识别方法,其特征在于,包括:
获取包含待识别文本的待识别图像,所述待识别文本包括多个字符;
对所述待识别图像进行图像识别,得到每个字符的字符位置结果、所述多个字符的字符连通结果及每个字符的字符识别结果,所述字符位置结果用于指示字符在所述待识别图像中的位置,所述字符连通结果用于指示各个字符与相邻字符之间的邻接关系;
根据所述字符识别结果和所述字符连通结果对所述多个字符进行拼接,得到所述待识别文本的文本识别结果。
2.根据权利要求1所述的方法,其特征在于,所述字符位置结果包括各个字符的中心点位置,所述字符连通结果包括用于表示字符之间邻接关系的字符邻接矩阵;所述对所述待识别图像进行图像识别,得到每个字符的字符位置结果、所述多个字符的字符连通结果及每个字符的字符识别结果,包括:
根据多个尺度对所述待识别图像进行下采样,得到所述多个尺度下的图像特征;
对于所述多个尺度下的图像特征进行特征融合,得到所述多个尺度下的特征融合结果;
根据所述多个尺度下的特征融合结果检测各个字符的位置,得到各个字符的中心点位置;
根据所述多个尺度下的特征融合结果和各个字符的中心点位置分析各个字符的邻接关系,得到各个字符之间的字符邻接矩阵;
根据各个字符的所述字符位置结果,对所述待识别图像中的各个字符分别进行字符识别,得到各个字符的字符识别结果。
3.根据权利要求2所述的方法,其特征在于,所述根据所述多个尺度下的特征融合结果检测各个字符的位置,得到各个字符的中心点位置,包括:
对所述多尺度特征信息进行卷积处理,得到卷积结果;
根据所述卷积结果进行中心特征预测,得到中心点特征图,所述中心点特征图中的各个特征值表示对应像素点为字符中心点的概率;
根据所述中心点特征图,确定各个字符的中心点位置。
4.根据权利要求3所述的方法,其特征在于,在对所述多尺度特征信息进行卷积处理,得到卷积结果之后,所述方法还包括:
根据所述卷积结果进行顶点距离预测,得到各个字符的顶点特征图,所述顶点特征图中的各个特征值表示所述待识别图像中对应像素点与所述字符的边框的各个顶点之间的距离;
根据所述顶点特征图,确定各个字符的边框位置。
5.根据权利要求4所述的方法,其特征在于,在对所述多尺度特征信息进行卷积处理,得到卷积结果之后,所述方法还包括:
根据所述卷积结果进行偏移预测,得到偏移特征图,所述偏移特征图中的各个特征值表示所述待识别图像中对应像素点的偏移量,所述偏移量用于调整所述边框位置;
根据所述偏移量对所述各个字符的边框位置进行调整。
6.根据权利要求2所述的方法,其特征在于,所述根据所述多个尺度下的特征融合结果和各个字符的中心点位置分析各个字符的邻接关系,得到各个字符之间的字符邻接矩阵,包括:
根据多个尺度下的特征融合结果,计算各个字符在所述待识别图像中的旋转角度和字符尺度;
根据各个字符的中心点位置以及各个字符的旋转角度和字符尺度,确定各个字符的字符位置特征;
根据各个字符的中心点位置,计算每个字符与其他字符的相似度;
根据各个字符的字符位置特征和每个字符与其他字符的相似度,构建每个字符的连接图;
根据每个字符的连接图,确定各个字符之间的邻接关系;
根据各个字符之间的邻接关系,构建所述字符邻接矩阵。
7.根据权利要求6所述的方法,其特征在于,所述根据每个字符的连接图,确定各个字符之间的邻接关系,包括:
对于每个字符的连接图,以字符对应的节点为中心点进行图卷积操作,得到图卷积结果;
根据所述图卷积结果中节点之间的连接结果,确定各个字符之间的邻接关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210393386.1/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序