[发明专利]一种非标准字体的汉字自动符识别方法在审
申请号: | 201710383558.6 | 申请日: | 2017-05-26 |
公开(公告)号: | CN107316055A | 公开(公告)日: | 2017-11-03 |
发明(设计)人: | 顾亦熹;高沁瑶;高兰英;高留其 | 申请(专利权)人: | 昆山遥矽微电子科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 南京纵横知识产权代理有限公司32224 | 代理人: | 董建林 |
地址: | 215325 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 非标准 字体 汉字 自动 识别 方法 | ||
1.一种非标准字体的汉字自动符识别方法,其特征在于,包括以下步骤:
步序1:基于稀疏编码得到待识别汉字图像中的基向量和稀疏系数,通过重构图像实现滤除噪声、处理边缘柔化;
步序2:利用梯度方向平面直方图抽取出复杂环境下待识别汉字边缘梯度特征并以此减轻影响汉字识别的负面作用;
步序3:将获得的待识别的非标准字体的汉字的边缘梯度特征输入到汉字分类器中,经行识别。
2.根据权利要求1所述的一种非标准字体的汉字自动符识别方法,其特征在于,步序1利用稀疏编码得到的基向量和稀疏系数是通过多次训练得到的,在训练阶段,需要对目标函数进行优化求解:
式中,X=(x1,x2,x3,…,xn)表示训练集中的n幅包含汉字的图像减去各自的平均灰度值后得到的m个k维向量的训练数据集,其中k为每幅图像的像素数量,同样的B=(b1,b2,b3,…,bn)表示经稀疏编码计算得到的n个k维稀疏系数向量;S表示稀疏系数矩阵,每一列的Si为一副图像的n维稀疏系数向量。β表示一个用来平衡重构误差和稀疏性的常数,Φ(Sij)表示非线性的稀疏惩罚函数,因此惩罚函数可以表示为:
该目标函数为优化目标,原理是基于整个图像求得所有的基向量B和对应的稀疏系数S。
3.根据权利要求2所述的一种非标准字体的汉字的识别方法,其特征在于,所述的1中重新构建图像的方法是根据基向量B对任意的一个待识别汉字的图像I中求取它的稀疏系数,然后再根据Inew(x,y)=BS+t进行重构得到复原图像Inew,上式中t为图像I的平均灰度值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆山遥矽微电子科技有限公司,未经昆山遥矽微电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710383558.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:天气信息实时显示方法及移动终端
- 下一篇:时间管理方法及装置