[发明专利]一种用于复杂文字识别的随机样本产生方法有效

申请号：	201510323798.8	申请日：	2015-06-12
公开（公告）号：	CN104899571B	公开（公告）日：	2018-12-04
发明（设计）人：	刘世林;何宏靖;吴雨浓	申请（专利权）人：	成都数联铭品科技有限公司
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/62;G06N3/02
代理公司：	暂无信息	代理人：	暂无信息
地址：	610041 四川省成都市高新区***	国省代码：	四川;51
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种用于复杂文字识别随机样本产生方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及图像识别领域，特别涉及一种用于复杂文字识别的随机样本产生方法。在复杂文字识别中，通过分析文字复杂性的原因，在与待识别字符相似的标准字符的基础上使用随机样本生成器产生的包含待识别图片噪声模型和扭曲特征模型的大量样本。随机样本生成器自动生成的训练样本中包含各种复杂的噪声和扭曲变形，可以满足各种复杂文字识别的需要；将上述随机样本作为训练样本输入深度神经网络中，可以解决训练深度神经网络来识别文字时需要大量人工标注的问题，使复杂文字图像的自动识别变得更加简单易行，显著节省了相关的人工成本。

技术领域

本发明涉及图像识别领域，特别涉及一种用于复杂文字识别的随机样本产生方法。

背景技术

图片识别在智能识别领域具有十分重要的意义，随着科技的进步和社会的发展，对图片中文字的自动识别的需求量也急速增加。传统的光学文字识别(OCR)系统常常用于识别使用光学设备扫描生成的文档，比如数字化古籍，识别名片、发票、表单等。通常这类扫描文档有着比较高的分辨率和对比度，而且打印字体一般都比较单一规整，提取用于识别的单个文字变得比较简单。所以这类文档识别的核心是消除噪音，噪音的消除方法比较多：比如使用高斯进行平滑化处理，然后使用阈值化对图片进行二值化，最后提取工程化设计好的特征向量进行模版匹配或者交付给分类器进行识别。

随着互联网的发展和移动设备的普及，产生了大量含有复杂噪音或者各种变形的文字图片，比如验证码图片、随手拍照片、车辆车牌等。复杂噪音产生的原因既包括了客观因素，比如拍照状况的复杂性、拍照设备的质量偏低；也包括了主观因素，比如为了网站安全，将验证码的噪音和扭曲都人为设计得很复杂。为了从大量公开的多媒体数据中挖掘出有价值的信息，识别这些复杂文字图片开始变得很有意义。

识别这些复杂文字时，使用传统的OCR方法，在识别速度和准确性方面已经难以满足庞大数据的识别要求。随着人工神经网络的出现，使得图像和语音识别变得简单高效；而深度神经网络在图像和语音识别领域都得到了突破性的进展，但是使用神经网络来进行文字或者语音识别之前，需要输入大量的标注数据来完成神经网络的训练；而深度神经网络所需要的标注数据量更加巨大，比如谷歌的语音识别系统使用了上万小时的带标注的语音训练数据，这就需要消耗大量的人力成本。

发明内容

本发明的目的在于克服现有技术中所存在的上述不足，提供一种用于复杂文字识别的随机样本产生方法。通过分析文字复杂性的原因，自动生成大量的可供深度神经网络使用的包含各种噪声和扭曲特征的训练样本，解决了现有技术中使用深度神经网络识别文字时需要大量的人力标注的问题，显著的节约了人力成本；提高识别的效率。

为了实现上述发明目的，本发明提供了以下技术方案：

一种用于复杂文字识别的随机样本产生方法，包括以下实现步骤：

(1-1)选取一定数量的待处理样本(比如说500个)。将目标样本图片中所包含的字符切分出来，将待处理图片中的字符串切分成仅包含单个字符的待处理子图片。其中所述待处理样本图片从待识别图片集中选取，包含待识别图片的一般噪声特征和、或扭曲特征。本发明随机样本生成方法的目的是用于复杂文字识别；因此在进行样本分析时，选取的待处理图片也应该是具有待识别图片的一般特征，比如说待识别图片中包含点状背景噪声和线条噪声，那么选取的待处理图片中也应该包含这些特征，以便于在接下来步骤中来构建相应的模型。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于成都数联铭品科技有限公司，未经成都数联铭品科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201510323798.8/2.html，转载请声明来源钻瓜专利网。

上一篇：一种基于图像配准的机械式表计识别方法
下一篇：一种印刷机纸张量报警装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种用于复杂文字识别的随机样本产生方法有效

专利文献下载