[发明专利]一种基于分割和形变LSTM的手写体蒙古文检测和识别方法在审
申请号: | 202110689571.0 | 申请日: | 2021-06-22 |
公开(公告)号: | CN113420760A | 公开(公告)日: | 2021-09-21 |
发明(设计)人: | 萨和雅;麻泽蕊;仁庆道尔吉;代钦 | 申请(专利权)人: | 内蒙古师范大学 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/38;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 西安智大知识产权代理事务所 61215 | 代理人: | 段俊涛 |
地址: | 010010 内蒙古自*** | 国省代码: | 内蒙古;15 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 分割 形变 lstm 手写体 蒙古文 检测 识别 方法 | ||
一种基于分割和形变LSTM的手写体蒙古文检测和识别方法,利用基于分割的任意形状文本检测器SAST实现对复杂环境中手写体蒙古文的检测;用RoI Rotate模块将文本的检测和识别功能结合;将提取得到的文本候选框作为输入图像,使用形变LSTM结合CTC模块实现对输入图像的文本识别。本发明利用SAST以更有效地提取任意形状文本的多边形表示,同时可以捕捉像素的长范围相关性,一次获得更加可靠的分割结果,通过RoI Rotate模块的应用将手写体蒙古文的检测和识别两个阶段的内容进行连接,有助于进一步提高训练效率。将循环神经网络与形变LSTM进行结合,在实现手写体蒙古文识别中有助于进一步提高识别准确率。
技术领域
本发明属于人工智能技术领域,涉及文字检测与识别,特别涉及一种基于分割和形变LSTM的手写体蒙古文检测和识别方法。
背景技术
随着互联网与人工智能的快速发展,教育信息化已经开始影响并改变传统教育方式,在线解答等人机交互的场景越来越普遍,手写检测与识别问题成为了计算机视觉领域的一个研究方向。对于人类来说辨别并且识别手写文字是一件很简单的事,但这对于计算机而言非常复杂。近年来,深度卷积神经网络的发展给计算机视觉领域带来了革命性的变化,卷积神经网络和循环神经网络的结合在基于图像分割以及序列识别问题中取得了巨大的成功,推动了手写检测与识别领域的进展。作为模式识别的一个重要研究领域,手写检测和识别得到了学术界的广泛研究和关注。热门语言(如汉文、英文、日文)的手写检测和识别研究已经从简单的孤立词识别发展到文本行识别、无约束手写识别、文档识别和场景文字检测和识别等领域。
而蒙古文等小众语言的手写检测和识别起步较晚、相关研究较少,且蒙古文具有词汇量巨大、书写自由、字符变形严重、字符书写较长等特点,这些都给蒙古文手写体的检测和识别都带来了巨大挑战。
发明内容
为了克服上述现有技术的缺点,本发明的目的在于提供一种基于分割和形变LSTM的手写体蒙古文检测和识别方法,采用基于分割的形状文本检测器SAST(Single-ShotArbitrarily-Shaped Text)构造文本区域的多边形表示,SAST利用全卷积网络的上下文多任务学习框架来学习文本区域的各种几何特征。运用RoI Rotate模块,将文本的检测和识别功能结合起来。将提取到的文本候选框作为输入图像,使用形变LSTM(MOGRIFIER LSTM)结合CTC模块实现对输入图像的文本识别。
为了实现上述目的,本发明采用的技术方案是:
一种基于分割和形变LSTM的手写体蒙古文检测和识别方法,包括如下步骤:
第一步:获取手写体蒙古文图像作为输入图像,手写体蒙古文检测模型为基于分割的任意形状文本检测器SAST,检测复杂环境中手写体蒙古文,得到划分文本候选框的图像;
第二步:将进行过文本检测的手写体蒙古文图像,即划分文本候选框的图像作为RoI Rotate模块的输入图像,对定向的特征区域进行变换以获得轴对齐的特征图;
第三步:获取独立的特征图作为输入图像,使用形变LSTM结合CTC模块构成手写体蒙古文识别模型,实现文字识别。
与现有技术相比,本发明的有益效果是:
(1)本发明将SAST文本检测模型应用于手写体蒙古文的检测工作。
(2)本发明利用RoI Rotate模块,将蒙古文手写体的检测和识别两个大的技术点进行了结合,在实际应用中这有助于提高文字检测识别的效率。
(3)本发明将形变LSTM运用于蒙古文手写体识别研究,并与CTC模块进行了结合,可以有效提高蒙古文手写体识别的准确率。
附图说明
图1是本发明基于分割和形变LSTM的手写体蒙古文检测和识别方法的结构图。
图2是CAB结构示意图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于内蒙古师范大学,未经内蒙古师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110689571.0/2.html,转载请声明来源钻瓜专利网。