[发明专利]基于连体段的印刷体维吾尔文文档图像识别系统及方法有效
申请号: | 202010341026.8 | 申请日: | 2020-04-27 |
公开(公告)号: | CN111553336B | 公开(公告)日: | 2023-03-24 |
发明(设计)人: | 卢朝阳;李楠;李静 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06V30/14 | 分类号: | G06V30/14;G06V30/146;G06V30/164;G06V30/19 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 田文英;王品华 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 连体 印刷体 维吾尔文 文档 图像 识别 系统 方法 | ||
本发明公开一种基于连体段的印刷体维吾尔文文档图像识别系统及方法,其实现的步骤为:(1)建立印刷体维吾尔文连体段的特征模板库;(2)输入待识别的印刷体维吾尔文文档图像;(3)对输入的文档图像进行预处理;(4)生成连体段图像;(5)对连体段图像进行预处理;(6)提取连体段图像的Gabor特征向量;(7)对连体段图像进行分类识别;(8)输出识别的文档图像对应的文本格式文档。本发明能对包含多个单词的印刷体维吾尔文文档图像进行识别,识别准确度高、识别速度快,能够按照印刷体维吾尔文文档图像的书写顺序和格式将文档图像转换为文本文档。
技术领域
本发明属于光学字符识别技术领域,更进一步涉及光学字符识别技术领域中的一种基于连体段的印刷体维吾尔文文档图像识别系统及方法。本发明可用于识别印刷体维吾尔文文档图像,并将印刷体维吾尔文文档图像以文本格式输出,实现印刷体维吾尔文纸质文档的电子化。
背景技术
印刷体维吾尔文纸质文档电子化,有助于维吾尔族文化的继承与发扬,有助于新疆地区的信息化发展,有助于民族团结。对于印刷体维吾尔文识别技术的研究按识别对象可分为基于字符、基于连体段和基于单词。目前,针对印刷体维吾尔文文档识别的研究通常选取单词或字符为识别单位。由于维吾尔文属于粘连型拼音文字,字符虽然数目较少,但字符高宽比不统一,字符之间相似度较高且多为粘连状态,导致字符切分极其困难,字符切分准确率较低、识别准确率较低;而对于单词而言,单词种类数目繁多,导致数据采集工作耗时耗力,对其分类识别时速度较慢;相较于字符和单词,选取连体段为识别单位有以下优势:连体段切分难度适中;连体段之间相似度适中;连体段种类数目适中。
新疆大学在其申请的专利文献“一种印刷体维吾尔文图像单词的高精度匹配算法”(申请号:CN201811612926.0,申请公开号:CN 109766420 A,申请日:2018-12-27)中公开了一种印刷体维吾尔文单词图像的高精度匹配算法,该算法可用于印刷体维吾尔文单词图像之间的高精度匹配。该匹配算的实现步骤是:步骤1,利用SIFT特征,得到检索图片和匹配图片的局部特征点;步骤2,对局部特征点进行特征匹配;步骤3,对匹配的结果数目进行一次预匹配;步骤4,对预匹配后的特征对象进行一次映射处理后再进行投射变换,根据投射变换的结果对匹配词进行检索结果鉴定,完成检索图片和匹配图片之间的高精度匹配。该方法虽然能实现对印刷体维吾尔文单词图像进行高精度匹配,并且经过优化之后,该方法检索一个单词会匹配到包含这个单词的所有单词组合,但是,该方法仍然存在的不足之处是:该方法适用于只包含一个单词的文档图像识别,无法适用于包含多个单词的文档图像识别,原因是包含多个单词的文档图像需要经过切分处理后得到单个的单词图像,才可直接使用该方法,所以该方法无法直接适用于包含多个单词的文档图像识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010341026.8/2.html,转载请声明来源钻瓜专利网。