[发明专利]一种非标准字体的汉字自动符识别方法在审

申请号：	201710383558.6	申请日：	2017-05-26
公开（公告）号：	CN107316055A	公开（公告）日：	2017-11-03
发明（设计）人：	顾亦熹;高沁瑶;高兰英;高留其	申请（专利权）人：	昆山遥矽微电子科技有限公司
主分类号：	G06K9/62	分类号：	G06K9/62
代理公司：	南京纵横知识产权代理有限公司32224	代理人：	董建林
地址：	215325 江苏***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种非标准字体汉字自动识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种非标准字体的汉字自动符识别方法，其特征在于，包括以下步骤：

步序1：基于稀疏编码得到待识别汉字图像中的基向量和稀疏系数，通过重构图像实现滤除噪声、处理边缘柔化；

步序2：利用梯度方向平面直方图抽取出复杂环境下待识别汉字边缘梯度特征并以此减轻影响汉字识别的负面作用；

步序3：将获得的待识别的非标准字体的汉字的边缘梯度特征输入到汉字分类器中，经行识别。

2.根据权利要求1所述的一种非标准字体的汉字自动符识别方法，其特征在于，步序1利用稀疏编码得到的基向量和稀疏系数是通过多次训练得到的，在训练阶段，需要对目标函数进行优化求解：

式中，X＝(x₁,x₂,x₃,…,x_n)表示训练集中的n幅包含汉字的图像减去各自的平均灰度值后得到的m个k维向量的训练数据集，其中k为每幅图像的像素数量，同样的B＝(b₁,b₂,b₃,…,b_n)表示经稀疏编码计算得到的n个k维稀疏系数向量；S表示稀疏系数矩阵，每一列的S_i为一副图像的n维稀疏系数向量。β表示一个用来平衡重构误差和稀疏性的常数，Φ(S_ij)表示非线性的稀疏惩罚函数，因此惩罚函数可以表示为：

Φ(Sij)=(Sij2+ϵ)12]]>

该目标函数为优化目标，原理是基于整个图像求得所有的基向量B和对应的稀疏系数S。

3.根据权利要求2所述的一种非标准字体的汉字的识别方法，其特征在于，所述的1中重新构建图像的方法是根据基向量B对任意的一个待识别汉字的图像I中求取它的稀疏系数，然后再根据I_new(x,y)＝BS+t进行重构得到复原图像I_new，上式中t为图像I的平均灰度值。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于昆山遥矽微电子科技有限公司，未经昆山遥矽微电子科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201710383558.6/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种非标准字体的汉字自动符识别方法在审

专利文献下载