[发明专利]一种文本识别方法和装置在审
申请号: | 201910108577.7 | 申请日: | 2019-01-18 |
公开(公告)号: | CN111461105A | 公开(公告)日: | 2020-07-28 |
发明(设计)人: | 刘聪海;陈亮亮;方清;曾晓嘉;淦小健;朱正一;崔子玲 | 申请(专利权)人: | 顺丰科技有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62 |
代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 黄威 |
地址: | 518000 广东省深圳市南山区学府路(以南)*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 识别 方法 装置 | ||
1.一种文本识别方法,其特征在于,包括:
获取包含目标文本的待识别图像;
根据预置的文本识别网络模型以及预置的特征词从所述待识别图像中确定特征文本区域;
根据训练后的文本提取网络模型从所述特征文本区域中提取文本信息,所述文本提取网络模型由四个卷积神经网络CNN模块、一个循环神经网络RNN模块以及一个CTC模块组成;
根据所述文本信息确定所述目标文本。
2.根据权利要求1所述的方法,其特征在于,所述根据预置的文本识别网络模型以及预置的特征词从所述待识别图像中确定特征文本区域,包括:
根据所述文本识别网络模型从所述待识别图像中确定文本区域;
根据所述特征词从所述文本区域中确定所述特征文本区域。
3.根据权利要求1所述的方法,其特征在于,所述根据所述文本信息确定所述目标文本,包括:
将所述文本信息映射到训练后的高维空间模型中,得到所述特征词与多个子文本的词距;
将词距最小的子文本确定为所述目标文本。
4.根据权利要求3所述的方法,其特征在于,所述将所述文本信息映射到训练后的高维空间模型中之前,所述方法还包括:
根据训练样本训练所述高维空间模型,所述训练样本为已知词距的样本。
5.根据权利要求1所述的方法,其特征在于,所述根据预置的文本识别网络模型以及预置的特征词从所述待识别图像中确定特征文本区域之前,所述方法还包括:
根据预置的角度检测模型检测所述待识别图像,得到所述待检测图像的倾斜角度;
根据所述倾斜角度对所述待识别图像进行角度调整,得到调整后的待识别图像;
所述根据预置的文本识别网络模型以及预置的特征词从所述待识别图像中确定特征文本区域,包括:
根据预置的文本识别网络模型以及预置的特征词从所述调整后的待识别图像中确定特征文本区域。
6.根据权利要求1所述的方法,其特征在于,所述根据训练后的文本提取网络模型从所述特征文本区域中提取文本信息之前,所述方法还包括:
构建所述文本提取网络模型;
根据CTC损失值对所述文本提取网络模型进行训练,得到所述训练后的文本提取网络模型。
7.根据权利要求1至6中任一项所述的方法,其特征在于,所述CNN模块由卷积层、第一BN层、第一rulu层以及最大池化层组成,所述RNN模块由flatten层、第一全连接层、第二BN层、第二rulu层、dropout层、第一双向RNN层、第二全连接层、第二双向RNN层、第三全连接层以及softmax层组成。
8.根据权利要求1至6中任一项所述的方法,其特征在于,所述目标文本为门牌文本信息。
9.一种文本识别装置,其特征在于,包括:
获取单元,用于获取包含目标文本的待识别图像;
第一确定单元,用于根据预置的文本识别网络模型以及预置的特征词从所述待识别图像中确定特征文本区域;
第一提取单元,用于根据训练后的文本提取网络模型,从所述特征文本区域中提取文本信息,所述文本提取网络模型由四个卷积神经网络CNN模块、一个循环神经网络RNN模块以及一个CTC模块组成;
第二确定单元,用于根据所述文本信息确定所述目标文本。
10.根据权利要求9所述的装置,其特征在于,所述第一确定单元具体用于:
根据所述文本识别网络模型从所述待识别图像中确定文本区域;
根据所述特征词从所述文本区域中确定所述特征文本区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于顺丰科技有限公司,未经顺丰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910108577.7/1.html,转载请声明来源钻瓜专利网。