[发明专利]一种手写维吾尔文单词切分识别方法有效
申请号: | 201810538114.X | 申请日: | 2018-05-30 |
公开(公告)号: | CN108764155B | 公开(公告)日: | 2021-10-12 |
发明(设计)人: | 艾斯卡尔·艾木都拉;吾加合买提·司马义;玛依热·依布拉音 | 申请(专利权)人: | 新疆大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34;G06K9/40 |
代理公司: | 成都希盛知识产权代理有限公司 51226 | 代理人: | 杨冬;何强 |
地址: | 830046 新疆维*** | 国省代码: | 新疆;65 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 手写 维吾尔文 单词 切分 识别 方法 | ||
本发明的一种手写维吾尔文单词切分识别方法属于手写体识别领域,特别适用于在移动终端上手写维吾尔文单词的单词切分的识别方法。本发明所要解决的技术问题是提供一种不做预先探测延迟笔画的利用手写轨迹局部信息的单词切分方法,包括以下步骤:预处理;轨迹局部信息点探测;检测手写轨迹中的平直点、局部最大点/峰点、局部最小点/谷点、局部最右点、局部最左点、交叉点以及各笔画的起点和终点等信息点;基于轨迹局部信息点的单词过切分;切分块合并;组合切分块,形成字母。本发明的手写维吾尔文单词切分方法,由于不需要进行预先延迟笔画处理,因此处理更加快捷,具有较高的通用性,适合自然手写单词的切分问题。
技术领域
本发明属于手写体识别领域,特别适用于在移动终端上手写维吾尔文单词的单词切分的识别方法。
背景技术
手写识别是模式识别领域中应用广泛的分支之一。手写识别有两大类,一是对于实时记录的手写轨迹上进行识别的联机手写识别技术,另一种是对于手写样式图像的识别技术,即脱机手写识别技术。对不同文种或文字的手写识别实现方法有所不同。有些文字中字母是表示意义的单元,比如中文。对于字母为意义单元的手写识别主要对其包含的所有字母进行识别,而且常用字母的数量有限,完全可能开发出能分辨这些常用字母的分类器。在拼音文字中,单词是基本意义单元。所以对拼音文字而言,单词是其手写识别的主要对象。拼音文字中词汇量一般很大,导致对拼音文字的手写单词识别技术难以实现符合所有单词的水平。拼音文字中的单词由字母连接而成。根据拼音文字的这种属性,可以用多种方法来实现其手写识别技术。
对拼音文字的手写识别可以用两种识别策略。一,把整个单词作为直接识别单元进行识别,叫做整体单词识别。与其相反,另一种策略首先要把单词中的字母分割出来,然后用已经训练好的字母识别器对各分割出来的字母进行识别,最后形成单词识别结果。从单词中把个字母分割叫做字母分割或单词切分,用这种单词切分和字母识别的结合来实现单词识别的方法叫做基于切分的单词识别或简称切分单词识别。整体单词识别和切分单词识别都有其长短之处。整体单词识别在单词类别数据不是很大的情况下可以获得很高的准确率。它的这种属性让它非常适合应用于特定场合的手写识别任务,比如手写登录等。切分单词识别的优势在于它要识别的单词类别数据可以无穷大,是解决拼音文字单词识别问题的最终方案,也是开发公用手写输入法的必经之路。
维吾尔文有32个基本字母类型,每个字母类型有2-8个字母形式。在单词中该用哪个字母形式由字母在单词中的位置决定。除了126种字母形式之外,还有一个特殊字符和一个复合字符在实际书写中十分常用。这个特殊字符和复合字符各有两种形式,还是由单词中的位置来选用。所以维吾尔文中我们应该考虑的字母形式总共有130种。
中国专利CN104899601A,发明名称为:一种手写维吾尔文单词识别方法,公开了一种涉及手写维吾尔文单词识别方法,该方法首先对手写维文单词预处理,接着分别提取了维文单词的笔画结构特征和梯度特征,笔画结构特征是直接在时间坐标序列上提取的,而梯度特征是把预处理后手写维吾尔文单词的时间坐标序列映射为二维图像,在二维的图像中提取的,然后将两者特征进行串行融合,最后采用欧式距离分类器进行分类识别,得到识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新疆大学,未经新疆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810538114.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于多特征机器学习的水面垃圾识别方法
- 下一篇:一种显示面板以及控制方法