[发明专利]一种文本识别方法和装置在审

申请号：	201910108577.7	申请日：	2019-01-18
公开（公告）号：	CN111461105A	公开（公告）日：	2020-07-28
发明（设计）人：	刘聪海;陈亮亮;方清;曾晓嘉;淦小健;朱正一;崔子玲	申请（专利权）人：	顺丰科技有限公司
主分类号：	G06K9/32	分类号：	G06K9/32;G06K9/62
代理公司：	深圳翼盛智成知识产权事务所(普通合伙) 44300	代理人：	黄威
地址：	518000 广东省深圳市南山区学府路（以南）***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种文本识别方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开了一种文本识别方法、装置及存储介质，本申请文本识别装置获取包含目标文本的待识别图像；根据预置的文本识别网络模型以及预置的特征词从待识别图像中确定特征文本区域；再根据训练后的文本提取网络模型从特征文本区域中提取文本信息，文本提取网络模型由四个CNN模块、一个RNN模块以及一个CTC模块组成；最后根据文本信息确定目标文本。该方案从待识别图像中提取(剪切)与特征词相关的文本区域，再根据文本提取网络模型从提取出的特征文本区域中提取文本信息，然后从文本信息中识别出目标文本，故该方案可以自动从图像中识别出目标文本，且只提取与特征词相关的文本区域的文本信息可以降低无关文本的干扰程度，识别准确率高。

技术领域

本申请涉及图像识别领域，具体涉及一种文本识别方法和装置。

背景技术

自然场景图像指的是图片中除了含有文字之外还含有其他掺杂场景的图像，从自然场景图像中提取指定类型的文本难度很大。

例如，在现在的地图系统里，往往需要提供小区内部各个单元楼栋门牌号信息来满足实际的使用需求，对于快递业务来说，如果电子地图能够提供楼栋号的高精度定位，可以大大节省人力的损耗，加快投递速度。但是由于从自然场景图像中提取门牌文本信息(提取指定类型的文本)难度很大，故构建此类地图往往需要采用人员从含有门牌文本信息的自然场景图片中手工采集门牌文本信息，或实地到访手工采集门牌文本信息。

发明内容

本申请实施例提供一种文本识别方法、装置，用于从图像中自动获取目标文本。

一方面，本申请提供一种文本识别方法，所述方法包括：

获取包含目标文本的待识别图像；

根据预置的文本识别网络模型以及预置的特征词从所述待识别图像中确定特征文本区域；

根据训练后的文本提取网络模型从所述特征文本区域中提取文本信息，所述文本提取网络模型由四个卷积神经网络CNN模块、一个循环神经网络RNN模块以及一个CTC模块组成；

根据所述文本信息确定所述目标文本。

可选的，所述根据预置的文本识别网络模型以及预置的特征词从所述待识别图像中确定特征文本区域，包括：

根据所述文本识别网络模型从所述待识别图像中确定文本区域；

根据所述特征词从所述文本区域中确定所述特征文本区域。

可选的，所述根据所述文本信息确定所述目标文本，包括：

将所述文本信息映射到训练后的高维空间模型中，得到所述特征词与多个子文本的词距；