[发明专利]一种强噪声复杂背景图像中的汉字定位及识别方法在审
申请号: | 201910731914.8 | 申请日: | 2019-08-06 |
公开(公告)号: | CN110458170A | 公开(公告)日: | 2019-11-15 |
发明(设计)人: | 蔡浩;陈小明;孙浩军;张承钿;姚浩生;胡超;刘正阳;梁道远;曾鑫;白璐 | 申请(专利权)人: | 汕头大学;广东叁玖捌大数据科技有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/62;G06N3/04;G06N3/08;G06K9/32 |
代理公司: | 44202 广州三环专利商标代理有限公司 | 代理人: | 张泽思<国际申请>=<国际公布>=<进入 |
地址: | 515000*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种强噪声复杂背景图像中的汉字定位及识别方法,该定位方法包括:先采集包含汉字的强噪声复杂背景图像,再根据采集数据样品,构建出神经网络模型,并以此训练和优化该神经网络模型的参数;对待定位的第一背景图像,通过训练好的神经网络模型对其进行尺寸调整,并筛选出相应的第一边界框集合和每个边界框对应的置信度,在根据置信度筛选出每个汉字对应的边界框,实现汉字定位。采用本发明技术方案能提高在强噪声复杂背景图像中汉字定位及识别的准确性。 | ||
搜索关键词: | 汉字 复杂背景图像 神经网络模型 边界框 强噪声 置信度 筛选 背景图像 采集数据 尺寸调整 构建 集合 采集 优化 | ||
【主权项】:
1.一种强噪声复杂背景图像中的汉字定位方法,其特征在于,包括:/n获取若干个包含汉字的背景图像,其中,每个汉字分别设置在其对应预设的矩形边界框内;所述背景图像为强噪音复杂背景图像;/n以所述背景图像为输入,以矩形边界框和置信度为输出,构建神经网络模型;其中,每个矩形边界框对应一个置信度,每个置信度对应一个汉字类别;/n获取待定位的第一背景图像,通过所述神经网络模型,调整所述第一背景图像的尺寸,并根据所述神经网络模型内设置的边框调整参数和默认边界框,确定所述第一背景图像的第一边界框集合;/n分别计算所述第一边界框集合内各边界框对应的置信度,并通过所述神经网络模型,从所述第一边界框集合中筛选出N个边界框,以实现所述第一背景图像的汉字定位;其中,所述第一背景图像包含N个汉字,所述N个汉字分别一一对应所述N个边界框;N为正整数。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汕头大学;广东叁玖捌大数据科技有限公司,未经汕头大学;广东叁玖捌大数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910731914.8/,转载请声明来源钻瓜专利网。
- 上一篇:一种岩屑CT图像特征识别方法
- 下一篇:一种车牌识别的方法以及相关装置