[发明专利]一种手写维吾尔文单词切分识别方法有效
申请号: | 201810538114.X | 申请日: | 2018-05-30 |
公开(公告)号: | CN108764155B | 公开(公告)日: | 2021-10-12 |
发明(设计)人: | 艾斯卡尔·艾木都拉;吾加合买提·司马义;玛依热·依布拉音 | 申请(专利权)人: | 新疆大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34;G06K9/40 |
代理公司: | 成都希盛知识产权代理有限公司 51226 | 代理人: | 杨冬;何强 |
地址: | 830046 新疆维*** | 国省代码: | 新疆;65 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 手写 维吾尔文 单词 切分 识别 方法 | ||
1.一种手写维吾尔文单词切分识别方法,其特征在于,包括以下步骤:
步骤1:预处理:
1.1去燥和重复点,
1.2轨迹点插入,
1.3平滑滤波,
1.4等距离轨迹点采样;
步骤2:轨迹局部信息点探测:
检测手写轨迹中的平直点、局部最大点/峰点、局部最小点/谷点、局部最右点、局部最左点、交叉点以及各笔画的起点和终点信息点,
2.1笔画起点和终点:笔画起点和笔画终点指的是笔画的第一点和笔画的最后点;
2.2平点检测:从笔画的第二点开始,在笔画轨迹中的每一点(xi,yi)与其前一点(xi-1,yi-1)形成一个线段,计算该线段对于横轴的倾斜度θ;如果线段的倾斜度小于平点检测阈值,则该点被记为平点;如果线段倾斜度大于平点检测阈值,则该点被记为非平点;
由相邻点构成的线段倾斜度计算公式:
2.3峰点和谷点检测:
2.3.1将笔画轨迹的笔画起点同时设定为初始峰点和谷点:峰点=谷点=笔画起点(x1,y1);
2.3.2在笔画轨迹上逐点寻找真实的峰点和谷点:
对笔画轨迹中的每一点(xi,yi)与其前一点(xi-1,yi-1)的坐标进行比较,如果该点位置高于前一点,则前一点暂时被认为谷点,直到遇到纵向位置比谷点低的轨迹点,这时更新谷点;
对笔画轨迹中的每一点(xi,yi)与其前一点(xi-1,yi-1)的坐标进行比较,如果该点位置低于前一点,则前一点暂时被认为峰点,直到遇到纵向位置比峰点高的轨迹点,这时更新峰点;
以上轨迹点比较操作可简单描述为:
若yi>yi-1:谷点=(xi-1,yi-1),访问下一点
若yi<yi-1:峰点=(xi-1,yi-1),访问下一点
2.3.3确定笔画轨迹的峰点和谷点;
2.4最右和最左点检测,
2.4.1笔画轨迹的笔画起点同时作为初始最右点和最左点,
2.4.2在笔画轨迹上逐点寻找真实的最右点和最左点:
对笔画轨迹中的每一点(xi,yi)与其前一点(xi-1,yi-1)的坐标进行比较,如果该点位于前一点的左边,则前一点暂时被认为最右点,直到遇到横向位置比最右点更右的轨迹点,这时更新最右点;
对笔画轨迹中的每一点(xi,yi)与其前一点(xi-1,yi-1)的坐标进行比较,如果该点位于前一点的右边,则前一点暂时被认为最左点,直到遇到横向位置比最左点更左的轨迹点,这时更新最左点;
2.4.3确定笔画轨迹的最右点和最左点;
2.5交叉点检测:
2.5.1用笔画轨迹中最初两个点作为两个相邻监测点P1和P2,并可连接形成线段,命名为检测线段;然后,剩下的笔画轨迹被逐点访问;其中每一点被命名为访问点;
2.5.2对每一个访问点P3与其前一个访问点P4形成第二个线段,命名为访问线段;
2.5.3用下列公式计算相邻监测点和相邻访问点构成的两条直线的交叉点,
k1,b1是由相邻监测点P1和P2构成的直线倾斜度和截距;k2,b2是由相邻访问点P3和P4构成的直线倾斜度和截距;θ和(x0,y0)是两条直线夹角和交叉点P0的坐标;
2.5.4如果交叉点位于相邻检测点和相邻访问点纵横坐标所形成的矩形之中,同时夹角θ小于设定的夹角阈值T_cross_angle,则第一个检测点P1被记为交叉点;
2.5.5访问所有访问点以后,回到步骤2.5.1,用笔画轨迹中的第二个点与其后一点新的相邻监测点,重复步骤2.5.2、2.5.3、2.5.4访问此相邻监测点之后的笔画轨迹;
步骤3:基于轨迹局部信息点的单词过切分,
3.1横向过切分:
用笔画轨迹中落于环形外的谷点作为初始切分点,形成初始切分块;
3.2用交叉点对初始切分点进行优化:访问每一个的初始切分块,并按如下方式处理,
3.2.1如果,初始切分块包含交叉点,并且交叉点的时间顺序优先于初始切分点,该初始切分点被认为重叠在环形结构里面,需丢弃;交叉点作为正确的切分点;
3.2.2如果初始切分点的时间顺序优先于交叉点,则初始切分点被保留;
3.3纵向过切分:对以上步骤得到的每一个的初始切分块,用局部最右点和局部最左点进行再次切分分析;
3.3.1如果切分块中最左点之前有步骤3.2确定的切分点,该切分点被保留;
3.3.2如果切分块中最左点之前有步骤3.2确定的交叉点,该切分块不做处理;
3.3.3如果切分块中最左点之前没有轨迹中记录的初始切分点或交叉点,该最左点之前应该加一个切分点;
步骤4:切分块合并,
4.1合并笔画起段和终段的切分块:
用切分块轨迹长度阈值来判断笔画起段和笔画终段的多余切分块;如果,切分块中轨迹序列长度小于切分块轨迹长度阈值,该切分块被作为多余切分块并进行其相邻的切分块合并;笔画起段的多余切分块与其后面的切分块合并,笔画终段的多余切分块则与其前面的切分块合并;
4.2合并横向平段:用如下条件来判断切分块是否为多余的平段切分块,并进行合并,
4.2.1切分块不包含峰、谷、右、左或相交点,则该切分块为多余平段,
4.2.2多余平段不包含笔画起点和终点;
多余平段切分块以其中点分为两部分,分别与其相邻的前后切分进行合并;具体把多余切分块的前半部分归属于前面的切分块,后半部分则归属于后面的切分块;
步骤5:组合切分块,形成字母,
切分块组合实现步骤如下:
5.1获取每个切分块的形状特性包括上下左右边界;然后判断切分是否包含峰点;
5.2把第一个切分块当做检测段,判断该切分块与其它切分块有没有重叠的现象;跟检测段比较的另一个切分块命名为访问段,访问段中落在于检测段左右边界之内的轨迹点当重叠段;
两个切分块的重叠程度用重叠度和被重叠度来衡量;
重叠度=重叠段宽度/访问段宽度,
被重叠度=重叠段宽度/检测段宽度
5.3如果检测段和访问段没有重叠,则用下一个切分块作为新的访问段判断与该检测段有没有重叠段;
如果有重叠,并且重叠度和被重叠度同时大于重叠度阈值,则该检测段和访问段被认为属于同一个字母;
如果检测段与任何其它访问段都没有重叠,则该检测段做为独立字母来处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新疆大学,未经新疆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810538114.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于多特征机器学习的水面垃圾识别方法
- 下一篇:一种显示面板以及控制方法