[发明专利]无上下文的手写形似汉字极速准确识别方法在审
申请号: | 202210565115.X | 申请日: | 2022-05-23 |
公开(公告)号: | CN114863445A | 公开(公告)日: | 2022-08-05 |
发明(设计)人: | 郭江华 | 申请(专利权)人: | 郭江华 |
主分类号: | G06V30/226 | 分类号: | G06V30/226;G06V10/74;G06V10/774;G06V10/764;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518100 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 无上 下文 手写 形似 汉字 准确 识别 方法 | ||
本申请采用特征笔画空间距离构建一个初阶的静态形似汉字集,大幅减少备选字的数量,以特征笔画空间的距离远近作为汉字之间的形似程度;将初阶形似汉字集精简化,构建二级分类器得到形似汉字组;利用平移不变聚束学习的输出置信因子对备选字排序,计算首选字与备选字之间的置信因子熵作为近似度,选择近似度高的作为形似汉字组,输出置信因子的计算兼顾频度计算,考虑偏离样本中心的特殊样本;将汉字识别目标层级特征与平移不变聚束学习相结合,目标层级特征作为先验知识,混合梯级特征作为输入提升识别率;实验表明,本申请的稳定性、可移植性、可扩展性和可维护性好,形似汉字识别快速准确,具有巨大的技术优势和广阔的运用前景。
技术领域
本申请涉及一种手写形似汉字极速识别方法,特别涉及一种无上下文的手写形似汉字极速准确识别方法,属于手写中文输入识别技术领域。
背景技术
信息的传播与记录有文字、图像、语音、视频等各种形式,其中以文字形式记载的信息占绝大多数,如各类书籍、档案文件、收据凭证等。数字化时代的到来,如何快速准确的将这些信息录入到计算机中是一个巨大的挑战。仅仅依靠人工处理低效且耗费巨大的人力物力,利用机器来识别并录入文字的想法应运而生。
汉字识别以汉字规范程度的不同分为手写体汉字识别和印刷体汉字识别两大类。其中印刷体汉字由于单字的大小和形态较规范,字与字之间不会存在粘连、重叠及过分等情况,识别相对简单。手写汉字识别以汉字样本信息量的不同又可分为联机识别和脱机识别。其中联机手写汉字是指汉字通过触摸板等类似媒介输入到计算机中,计算机得知汉字输入的笔画顺序,这大大减少了识别难度。而脱机手写汉字识别却仍然面对着很多的困难和挑战,由于缺少书写顺序和上下文支撑,其性能还是需要进一步提升。脱机手写汉字单字字形大小都不规范,不同的人有不同的书写风格,书写环境的不同也会造成汉字字形的变化,再加上汉字本身结构复杂,笔画数、种类数较之英文和数字多很多,汉字之间的形似程度较高等,使得脱机手写体汉字的识别非常困难。其中形似汉字的大量存在是影响识别正确率的一个重要原因,形似汉字是指字与字之间的差别非常微小,如“己”和“已”、“竟”和“竞”等。大量形似汉字的存在使得识别率受到限制,因此如果能够改善形似汉字的识别率,对于整体汉字识别率将会有明显的提升。
汉字识别目前的主要难点归纳为以下四个方面:(1)汉字数量众多,远远高于英语、拉丁语等其它西方语言,庞大的类别数使得一个完整的汉字识别系统体格庞大,构建过程工程量大且耗时长。(2)字形结构复杂,汉字最简单的汉字只有一笔,而最复杂的汉字有36笔,由于笔画繁多,许多汉字的结构较为复杂,再加上个人书写风格迥异导致识别起来较为困难。(3)书写随意不规范,在手写体中,原本规范的笔画如横、竖、撤、点、捺等容易变形,笔画的角度、长度变化;另外由于不同人的书写风格不一样且相互之间差异明显,相同汉字的不同书写者所写的字形结构都可能千差万别。(4)相似字多,汉字中有很多字形结构非常形似和易混淆的汉字,如“人入”、“士土”、“干千”、“暑署”、“酒洒”、“崇祟”等等,这些汉字之间的差别非常微小,高度形似的字在无约束的手写情况下由于变形、不规范等原因会导致字与字之间分辨非常困难。
综上,现有技术的无上下文的手写形似汉字识别仍然存在难题,本申请的难点和待解决的问题集中在以下方面:
(1)脱机手写汉字识别由于缺少书写顺序和上下文支撑,普遍性能较差,单字字形大小都不规范,不同的人有不同的书写风格,书写环境的不同也会造成汉字字形的变化,再加上汉字本身结构复杂,笔画数、种类数较之英文和数字多很多,汉字之间的形似程度较高等,脱机手写体汉字的识别非常困难,其中形似汉字的大量存在是影响识别正确率最重要的原因,现有技术缺少一个优秀的脱机手写汉字识别方法,缺少特征笔画空间距离构建初阶静态形似汉字集,无法减少备选字的数量,缺少以特征笔画空间距离远近作为汉字之间的形似程度,无法将初阶形似汉字集精简化,缺少构建二级分类器得到形似汉字组;缺少利用平移不变聚束学习的输出置信因子对备选字排序,缺少计算首选字与备选字之间的置信因子熵作为近似度,输出置信因子的计算没有兼顾频度计算,未考虑偏离样本中心的特殊样本,缺少将汉字识别目标层级特征与平移不变聚束学习相结合,脱机手写汉字的效果较差。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郭江华,未经郭江华许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210565115.X/2.html,转载请声明来源钻瓜专利网。