[发明专利]一种强噪声复杂背景图像中的汉字定位及识别方法在审

申请号：	201910731914.8	申请日：	2019-08-06
公开（公告）号：	CN110458170A	公开（公告）日：	2019-11-15
发明（设计）人：	蔡浩;陈小明;孙浩军;张承钿;姚浩生;胡超;刘正阳;梁道远;曾鑫;白璐	申请（专利权）人：	汕头大学;广东叁玖捌大数据科技有限公司
主分类号：	G06K9/34	分类号：	G06K9/34;G06K9/62;G06N3/04;G06N3/08;G06K9/32
代理公司：	44202 广州三环专利商标代理有限公司	代理人：	张泽思<国际申请>=<国际公布>=<进入
地址：	515000***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种强噪声复杂背景图像中的汉字定位及识别方法，该定位方法包括：先采集包含汉字的强噪声复杂背景图像，再根据采集数据样品，构建出神经网络模型，并以此训练和优化该神经网络模型的参数；对待定位的第一背景图像，通过训练好的神经网络模型对其进行尺寸调整，并筛选出相应的第一边界框集合和每个边界框对应的置信度，在根据置信度筛选出每个汉字对应的边界框，实现汉字定位。采用本发明技术方案能提高在强噪声复杂背景图像中汉字定位及识别的准确性。
搜索关键词：	汉字复杂背景图像神经网络模型边界框强噪声置信度筛选背景图像采集数据尺寸调整构建集合采集优化
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种强噪声复杂背景图像中的汉字定位方法，其特征在于，包括：/n获取若干个包含汉字的背景图像，其中，每个汉字分别设置在其对应预设的矩形边界框内；所述背景图像为强噪音复杂背景图像；/n以所述背景图像为输入，以矩形边界框和置信度为输出，构建神经网络模型；其中，每个矩形边界框对应一个置信度，每个置信度对应一个汉字类别；/n获取待定位的第一背景图像，通过所述神经网络模型，调整所述第一背景图像的尺寸，并根据所述神经网络模型内设置的边框调整参数和默认边界框，确定所述第一背景图像的第一边界框集合；/n分别计算所述第一边界框集合内各边界框对应的置信度，并通过所述神经网络模型，从所述第一边界框集合中筛选出N个边界框，以实现所述第一背景图像的汉字定位；其中，所述第一背景图像包含N个汉字，所述N个汉字分别一一对应所述N个边界框；N为正整数。/n

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于汕头大学;广东叁玖捌大数据科技有限公司，未经汕头大学;广东叁玖捌大数据科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910731914.8/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种强噪声复杂背景图像中的汉字定位及识别方法在审

专利文献下载