[发明专利]一种手写古文字检测方法有效
申请号: | 202010455027.5 | 申请日: | 2020-05-26 |
公开(公告)号: | CN111832390B | 公开(公告)日: | 2022-10-25 |
发明(设计)人: | 李然康;陈善雄;邱小刚;赵富佳;王定旺 | 申请(专利权)人: | 西南大学 |
主分类号: | G06V30/32 | 分类号: | G06V30/32;G06V10/82;G06V30/40;G06V30/18;G06V30/164;G06V30/19;G06N3/04 |
代理公司: | 济南鼎信专利商标代理事务所(普通合伙) 37245 | 代理人: | 刘海艳 |
地址: | 400715*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 手写 古文字 检测 方法 | ||
本发明提供一种手写古文字检测方法,包括:使用基于CNN的ATD网络对输入图像和对应的标注信息进行特征学习、字符分类,根据分类结果生成AT类候选框;使用基于NMS的MSER模型对输入的图像通过非局部均值滤波进行预处理,再使用MSER算法提取文本轮廓,然后由最小外接矩形生成候选框,并由NMS筛选出最精确的MT类候选框;ATD网络以及MSER模型同步输出同一个字符的两个不同的候选框,经过合并算法对两个候选框进行合并,得FT类文本框。在彝文、中文、拉丁文、意大利文等古籍数据集上的测试结果表明,本发明的方法具有较好的精度,为手写体古文字的检测研究迈出了坚实的一步。
技术领域
本发明主要涉及计算机视觉检测相关技术领域,具体是一种手写古文字检测方法。
背景技术
手写体文本检测是计算机视觉和模式识别领域的一项重要研究。手写体文本检测是指在手写的文本图像中确定所有文本出现的精确位置并用文本框将其精确标注的任务。由于写作的差异性,手写文本的轮廓、形状和排列方式有很大的不同。因此,手写文本的检测迎来了艰难的挑战。手写文本检测在文档翻译、古籍电子化、机器人视觉等领域有着广泛的应用,因此为了提高检测性能而不断对检测方法进行深度研究十分重要。
为了减少背景对图像检测精度的影响,对古籍文本图像的研究大多采用基于连通区域的方法,如最大稳定极值区域。这些方法速度很快,可以达到很高的精度,但由于这些方法对像素点比较敏感,预处理后仍然存在少量的噪声,噪声的存在会影响检测结果。因此,古籍文本检测仍处于初级阶段。
基于深度学习的方法显著提高了文本识别和检测任务的性能。文本检测的一个最新趋势是使用卷积神经网络来对不同层次的特征图进行学习以实现最终的检测。然而,由于古籍文本图像的缺陷、模糊性和背景噪声过大等特点,会导致检测精度不高。
发明内容
为解决目前技术的不足,本发明结合现有技术,从实际应用出发,提供一种手写古文字检测方法,在彝文、中文、拉丁文、意大利文等古籍数据集上的测试结果表明,本发明的方法具有较好的精度,为手写体古文字的检测研究迈出了坚实的一步。
本发明的技术方案如下:
一种手写古文字检测方法,包括:
使用基于CNN的ATD网络对输入图像和对应的标注信息进行特征学习,随后基于已标注的数据和已学习的数据对图像中的字符进行分类,根据分类结果生成AT类候选框;
使用基于NMS的MSER模型对输入的图像通过非局部均值滤波进行预处理,再使用MSER算法提取文本轮廓,然后由最小外接矩形生成候选框,并由NMS筛选出最精确的MT类候选框;
ATD网络以及MSER模型同步输出同一个字符的两个不同的候选框,经过合并算法对上述两个候选框进行合并,得到最终的FT类文本框。
进一步,在检测过程中,首先将文本图像进行分类处理,具体分为三类,分别为T类、PT类、B类;
其中,T类指完整的文本实例,PT类指文本图像中被污点覆盖或部分缺失的文本实例,B类指图像数据集中不属于上述两个类的所有对象,即图像中的背景。
进一步,所述ATD网络的架构包括卷积层、上采样层以及横向连接;
其中,卷积层为网络的前部分,其包括conv1到conv6六个卷积块,每个卷积块包含一组连续的层,每层由具有相同分辨率的特征图组成,每个卷积块由一个MAXPOOL层与另一个块分开,每个卷积块的特征图的分辨率是前一块的一半,深度是前一块的两倍,早期的特征映射捕获低层特征,而深度特征映射捕获语义信息非常强的特征;
上采样层用于提高经过池化后的卷积块中特征图的分辨率,相对应的,上采样层同样有六个块,包含unconv1到unconv6六个块。在每个块中间使用UNPOOL与另一个块分开,在上采样的特定阶段的特定块中的特征映射具有与卷积的相应阶段的相应层中的映射相同的分辨率和深度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南大学,未经西南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010455027.5/2.html,转载请声明来源钻瓜专利网。