[发明专利]一种文本识别方法及装置在审
申请号: | 201911285619.0 | 申请日: | 2019-12-13 |
公开(公告)号: | CN112990188A | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 李杰明;黄健超;周兴;蒲勇飞;陈院林;朱丽飞 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34;G06K9/62 |
代理公司: | 北京中博世达专利商标代理有限公司 11274 | 代理人: | 申健 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 识别 方法 装置 | ||
1.一种文本识别方法,其特征在于,包括:
获取待检测图片;
确定所述待检测图片中的目标文本检测区域,所述目标文本检测区域中包括所述待检测图片中的目标文本;其中,所述目标文本检测区域为多边形区域,所述多边形区域包括m个顶点对,m为大于2的正整数;m个顶点位于所述目标文本的一侧,其它m个顶点位于所述目标文本的另一侧;
将所述多边形区域校正为m-1个矩形区域,以得到校正后的目标文本检测区域;
对校正后的目标文本检测区域进行文本识别,并输出所述目标文本。
2.根据权利要求1所述的文本识别方法,其特征在于,
所述多边形区域为条带状。
3.根据权利要求1或2所述的文本识别方法,其特征在于,所述获取待检测图片,包括:
获取用户即时拍摄到的所述待检测图片,或者,从已经存储的图像中选取所述待检测图片。
4.根据权利要求1-3中任意一项所述的文本识别方法,其特征在于,所述确定所述待检测图片中的目标文本检测区域,包括:
根据所述待检测图片和预先训练出的文本检测网络,确定所述目标文本检测区域。
5.根据权利要求4所述的文本识别方法,其特征在于,所述根据所述待检测图片和预先训练出的文本检测网络,确定所述目标文本检测区域,包括:
将所述待检测图片输入到所述文本检测网络,得到初始目标文本检测区域;
对所述初始目标文本检测区域进行平滑处理,得到所述目标文本检测区域。
6.根据权利要求4或5所述的文本识别方法,其特征在于,所述文本识别方法还包括:
基于已标记文本区域的训练图片,预先训练得到所述文本检测网络;所述文本区域包括所述训练图片中的文本。
7.根据权利要求6所述的文本识别方法,其特征在于,所述基于已标记文本区域的训练图片,预先训练得到所述文本检测网络,包括:
根据预设的分割标签任务算法和所述训练图片,确定分割标签;所述分割标签用于表示所述训练图片中文本的中心线;
根据预设的回归标签任务算法、所述分割标签以及所述训练图片,确定回归标签;所述回归标签用于表示多个顶点对;在所述多个顶点对中,任意一个顶点对中顶点之间的连线与所述中心线相交;
根据所述分割标签、所述回归标签以及所述训练图片,训练得到所述文本检测网络。
8.根据权利要求7所述的文本识别方法,其特征在于,所述在所述多个顶点对中,任意一个顶点对中顶点之间的连线与所述中心线相交,包括:
该顶点对中顶点之间的连线与所述中心线相交的交点为第一交点,所述连线与所述第一交点的切线之间的夹角的数值为90±A,A小于或等于15。
9.根据权利要求1-8中任意一项所述的文本识别方法,其特征在于,所述将所述多边形区域校正为m-1个矩形区域,包括:
将所述多边形区域划分为m-1个互不交叠的四边形区域,其中,任意一个四边形区域是基于所述m个顶点对中相邻的两对顶点对得到的;其中,
在所述m个顶点对中,每个顶点对中的顶点分别位于所述目标文本检测区域的中心线的两侧,且该顶点对中顶点之间的连线的中点位于所述中心线上,所述中心线贯穿所述目标文本检测区域中的所有文本;
将所述m-1个互不交叠的四边形区域分别校正为m-1个矩形区域。
10.根据权利要求1-9中任意一项所述的文本识别方法,其特征在于,所述得到校正后的目标文本检测区域,包括:
将所述m-1个矩形区域按照水平方向依次拼接,以得到矩形的所述目标文本检测区域;
或者,
将所述m-1个矩形区域按照垂直方向依次拼接,以得到矩形的所述目标文本检测区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911285619.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种油烟机油盒清洗装置
- 下一篇:一种高能固体脉冲激光偏振合束装置