[发明专利]字符拼接方法、装置、网络设备及计算机可读存储介质在审
申请号: | 201910968425.4 | 申请日: | 2019-10-12 |
公开(公告)号: | CN112651396A | 公开(公告)日: | 2021-04-13 |
发明(设计)人: | 淦小健;刘聪海;陈亮亮;方清;曾晓嘉 | 申请(专利权)人: | 丰图科技(深圳)有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32 |
代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 彭绪坤 |
地址: | 518052 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字符 拼接 方法 装置 网络设备 计算机 可读 存储 介质 | ||
本申请实施例公开了一种字符拼接方法、装置、网络设备及计算机可读存储介质,本申请实施例可以提高文本的识别效果。本申请字符拼接装置获取包含目标文本的待识别图像;然后从待识别图像中确定目标字符以及目标字符的位置信息;再根据位置信息对目标字符进行线性拟合处理,得到字符拟合线;并根据位置信息分别确定各个目标字符与字符拟合线的方差;最后根据方差以及字符拟合线的斜率对目标字符进行拼接处理,得到目标文本。本方案可以根据字符的位置信息确定字符拟合线,并且根据字符与字符拟合线的方差及字符拟合线的斜率对字符进行拼接处理,在识别图像中的文本时,可以避免由于字符拼接顺序出错而导致的文本错乱的问题,提高文本的识别效果。
技术领域
本申请涉及图像识别技术领域,具体涉及一种字符拼接方法、装置、网络设备及计算机可读存储介质。
背景技术
自然场景图像指的是图片中除了含有文字之外还含有其他掺杂场景的图像,例如该自然场景图像可以为包含门牌信息的图片。
在快递地图系统里,如果可以提供小区内部各个单元楼栋的门牌信息,对于快递业务来说,可以大大节省人力的损耗,加快投递速度。但是自然场景图像中很多文本都是由多行或多列的字符组成的,在得到自然场景图像中的文本信息时,如果仅对文本字符进行识别的话,可能会由于字符顺序拼接出错,导致文本中的字符出现排列乱序的情况,文本的识别效果不佳。
发明内容
本申请实施例提供一种字符拼接方法、装置、网络设备及计算机可读存储介质,可以提高文本的识别效果。
第一方面,本申请实施例提供了一种字符拼接方法,包括:
获取包含目标文本的待识别图像;
从所述待识别图像中确定目标字符以及所述目标字符的位置信息;
根据所述位置信息对所述目标字符进行线性拟合处理,得到字符拟合线;
根据所述位置信息分别确定各个所述目标字符与所述字符拟合线的方差;
根据所述方差以及所述字符拟合线的斜率对所述目标字符进行拼接处理,得到所述目标文本。
在一些实施方式中,所述从所述待识别图像中确定目标字符以及所述目标字符的位置信息,包括:
根据训练后的特征识别网络模型从所述待识别图像中确定特征文本区域;
根据训练后的文本提取网络模型从所述特征文本区域中提取所述目标字符以及所述位置信息。
在一些实施方式中,所述根据所述位置信息对所述目标字符进行线性拟合处理,得到字符拟合线之前,所述方法还包括:
获取所述特征文本区域的长度信息以及宽度信息;
根据所述长度信息以及所述宽度信息对所述位置信息进行归一化处理,得到处理后的位置信息;
所述根据所述位置信息对所述目标字符进行线性拟合处理,得到字符拟合线,包括:
根据所述处理后的位置信息对所述目标字符进行线性拟合处理,得到所述字符拟合线。
在一些实施方式中,所述根据所述方差以及所述字符拟合线的斜率对所述目标字符进行拼接处理,得到所述目标文本,包括:
确定所述方差是否均小于预置的方差阈值;
若是,则根据所述斜率以及预置的拼接规则对所述目标字符进行拼接处理;
若否,则根据所述目标字符相对于所述字符拟合线的位置,将所述目标字符分为第一字符以及第二字符;
分别对所述第一字符以及所述第二字符进行拼接处理,得到第一文本以及第二文本;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于丰图科技(深圳)有限公司,未经丰图科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910968425.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种液压悬挂
- 下一篇:冻土接触面曲面剪切力测试装置