[发明专利]对满文单词正确分割各识别的满文单词中轴线的定位方法有效
申请号: | 201810580666.7 | 申请日: | 2015-09-29 |
公开(公告)号: | CN108830270B | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | 李敏;郑蕊蕊;许爽;吴宝春 | 申请(专利权)人: | 大连民族大学 |
主分类号: | G06K9/20 | 分类号: | G06K9/20 |
代理公司: | 大连智高专利事务所(特殊普通合伙) 21235 | 代理人: | 马庆朝;赫泽坤 |
地址: | 116600 辽宁省*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 满文 单词 正确 分割 识别 轴线 定位 方法 | ||
本分案申请公开了一种对满文单词正确分割各识别的满文单词中轴线的定位方法,属于文字处理领域,用于解决提高识别准确率的问题,要点是包括S1.单词图像预处理;S2.确定满文单词中轴线的宽度;S3.确定满文单词中轴线左右边界位置,效果是提高了识别准确率。
本申请是申请号2015106293443,申请日2015-09-29,发明名称“满文单词中轴线的定位方法”的分案申请。
技术领域
本发明涉及一种文字处理方法,特别是一种满文单词中轴线的定位方法。
背景技术
随着科学技术的发展,计算机已经能够对多种图像格式的文字进行识别和辨认(如英文、日文),满文作为世界语言的一种,还无法做到供计算机自动识别。如果能够让计算机做到自动识别、辨认满文,则可以将大量的满文文献进行电子化处理,这对于满文文献的研究与保存,乃至满族文化的研究与保存都有着十分重要的意义,而要想实现这一目标,首先需要对满文的中轴线进行定位。
发明内容
本发明是为了解决现有技术所存在的上述不足,提出一种准确率高,有助于计算机对满文单词进行正确分割各识别的满文单词中轴线的定位方法。
本发明的技术解决方案是:一种满文单词中轴线的定位方法,其特征在于:所述的方法依次由满文单词图像预处理、确定满文单词中轴线的宽度、确定满文单词中轴线左右边界位置三个步骤组成,其中:
满文单词图像预处理的步骤为:扫描满文文档,获得满文文档的彩色图像,并对满文文档的彩色图像进行二值化,采用垂直投影法提取每一列满文文档的图像,获得列图像,并对列图像采用水平投影法提取满文单词图像,然后对满文单词图像进行位置归一化处理,归一化处理的步骤是找到满文单词图像最外侧上、下、左、右四个点的坐标位置,以这四个点为边界,重新确定满文单词图像的大小,并用I、W、H分别表示归一化处理后的二值满文单词图像、二值满文单词图像的宽度数值和二值满文单词图像的高度数值,
确定满文单词中轴线宽度的步骤为:对二值满文单词图像I采用数学形态学进行处理,具体方法是采用长度为2的水平方向直线型形态学结构元素,对二值满文单词图像I进行腐蚀处理,得到I的腐蚀图像Ie,并求二值满文单词图像I与腐蚀图像Ie的纵向边缘图像Iv,即Iv=I-Ie,提取到满文单词的纵向边缘,然后对纵向边缘图像Iv进行垂直投影,统计纵向边缘图像Iv的每一列中所包含的黑色像素的个数,垂直投影序列以vp1表示,取向量vp1中不重复的元素,并按照数值从大到小的降序方式进行排列,得到新的向量vp2,并取vp2中的前3个元素分别标记为ind1、ind2和ind3,用wd表示中轴线的宽度,wdmin表示最小中轴线宽度,赋值wdmin=0,wdmax表示最大中轴线宽度,T为最大中轴线宽度的阈值,赋值T=1/3,则最大中轴线宽度wdmax为对T×W的结果向下取整后的值,即
分别定义wd1、wd2、wd3为3个候选中轴线宽度,wd表示最终确定的中轴线宽度,其中wd1=∣ind1-ind2∣-1,wd2=∣ind1-ind3∣-1,wd3=∣ind2-ind3∣-1,
如果(wdminwd1wdmax)并且(wdminwd2wdmax)并且(wdminwd3wdmax),则wd=wd1,
如果(wdminwd1wdmax)并且(wdminwd2wdmax)并且(wd3=wdmin或者wd3=wdmax),则取wd1和wd2中值较大的一个做为wd的输出值,即wd=max(wd1,wd2),
如果(wdminwd1wdmax)并且(wdminwd3wdmax)并且(wd2=wdmin或者wd2=wdmax),则取wd1和wd3中值较大的一个做为wd的输出值,即wd=max(wd1,wd3),
如果(wdminwd2wdmax)并且(wdminwd3wdmax)并且(wd1=wdmin或者wd1=wdmax),则取wd2和wd3中值较大的一个做为wd的输出值,即wd=max(wd2,wd3),
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连民族大学,未经大连民族大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810580666.7/2.html,转载请声明来源钻瓜专利网。