[发明专利]一种文本识别方法和装置在审
申请号: | 201910108577.7 | 申请日: | 2019-01-18 |
公开(公告)号: | CN111461105A | 公开(公告)日: | 2020-07-28 |
发明(设计)人: | 刘聪海;陈亮亮;方清;曾晓嘉;淦小健;朱正一;崔子玲 | 申请(专利权)人: | 顺丰科技有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62 |
代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 黄威 |
地址: | 518000 广东省深圳市南山区学府路(以南)*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 识别 方法 装置 | ||
本申请公开了一种文本识别方法、装置及存储介质,本申请文本识别装置获取包含目标文本的待识别图像;根据预置的文本识别网络模型以及预置的特征词从待识别图像中确定特征文本区域;再根据训练后的文本提取网络模型从特征文本区域中提取文本信息,文本提取网络模型由四个CNN模块、一个RNN模块以及一个CTC模块组成;最后根据文本信息确定目标文本。该方案从待识别图像中提取(剪切)与特征词相关的文本区域,再根据文本提取网络模型从提取出的特征文本区域中提取文本信息,然后从文本信息中识别出目标文本,故该方案可以自动从图像中识别出目标文本,且只提取与特征词相关的文本区域的文本信息可以降低无关文本的干扰程度,识别准确率高。
技术领域
本申请涉及图像识别领域,具体涉及一种文本识别方法和装置。
背景技术
自然场景图像指的是图片中除了含有文字之外还含有其他掺杂场景的图像,从自然场景图像中提取指定类型的文本难度很大。
例如,在现在的地图系统里,往往需要提供小区内部各个单元楼栋门牌号信息来满足实际的使用需求,对于快递业务来说,如果电子地图能够提供楼栋号的高精度定位,可以大大节省人力的损耗,加快投递速度。但是由于从自然场景图像中提取门牌文本信息(提取指定类型的文本)难度很大,故构建此类地图往往需要采用人员从含有门牌文本信息的自然场景图片中手工采集门牌文本信息,或实地到访手工采集门牌文本信息。
发明内容
本申请实施例提供一种文本识别方法、装置,用于从图像中自动获取目标文本。
一方面,本申请提供一种文本识别方法,所述方法包括:
获取包含目标文本的待识别图像;
根据预置的文本识别网络模型以及预置的特征词从所述待识别图像中确定特征文本区域;
根据训练后的文本提取网络模型从所述特征文本区域中提取文本信息,所述文本提取网络模型由四个卷积神经网络CNN模块、一个循环神经网络RNN模块以及一个CTC模块组成;
根据所述文本信息确定所述目标文本。
可选的,所述根据预置的文本识别网络模型以及预置的特征词从所述待识别图像中确定特征文本区域,包括:
根据所述文本识别网络模型从所述待识别图像中确定文本区域;
根据所述特征词从所述文本区域中确定所述特征文本区域。
可选的,所述根据所述文本信息确定所述目标文本,包括:
将所述文本信息映射到训练后的高维空间模型中,得到所述特征词与多个子文本的词距;
将词距最小的子文本确定为所述目标文本。
可选的,所述将所述文本信息映射到训练后的高维空间模型中之前,所述方法还包括:
根据训练样本训练所述高维空间模型,所述训练样本为已知词距的样本。
可选的,所述根据预置的文本识别网络模型以及预置的特征词从所述待识别图像中确定特征文本区域之前,所述方法还包括:
根据预置的角度检测模型检测所述待识别图像,得到所述待检测图像的倾斜角度;
根据所述倾斜角度对所述待识别图像进行角度调整,得到调整后的待识别图像;
所述根据预置的文本识别网络模型以及预置的特征词从所述待识别图像中确定特征文本区域,包括:
根据预置的文本识别网络模型以及预置的特征词从所述调整后的待识别图像中确定特征文本区域。
可选的,所述根据训练后的文本提取网络模型从所述特征文本区域中提取文本信息之前,所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于顺丰科技有限公司,未经顺丰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910108577.7/2.html,转载请声明来源钻瓜专利网。