[发明专利]一种基于MaskRCNN的汉字笔画分割提取方法及系统在审
申请号: | 202110347017.4 | 申请日: | 2021-03-31 |
公开(公告)号: | CN113011431A | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | 许勇;谭艳鸿 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/62;G06K9/00;G06N3/08;G06N3/04 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 李君 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 maskrcnn 汉字 笔画 分割 提取 方法 系统 | ||
本发明公开了一种基于MaskRCNN的汉字笔画分割提取方法,包括以下步骤:构成笔画分割数据集,并解析字体,生成训练集和验证集;构建MaskRCNN网络模型,所述MaskRCNN网络模型包含骨干网络、区域建议网络、分支网络;预设MaskRCNN网络模型的初始参数和迭代次数,对训练集进行图像增强补充数据;训练MaskRCNN网络模型,通过训练集更新网络参数,并通过验证集选择最优参数并保存;将待测汉字图像输入训练好的网络模型,得到笔画分割提取结果;本发明创新地利用实例分割领域Mask RCNN算法于汉字的笔画分割提取任务中,对比笔画提取的方法,处理效果和效率大幅度提升。
技术领域
本发明涉及图像分割的研究领域,特别涉及一种基于MaskRCNN的汉字笔画分割提取方法及系统。
背景技术
汉字是世界上最古老的文字之一,是我国文化得以生生不息的基础,而笔画是汉字的组成部分,研究汉字的结构构成、识别等离不开笔画,而汉字的笔画自动分割和提取是一个重要且挑战性的任务。汉字笔画分割提取的挑战性主要体现在汉字结构复杂,不同字体的笔画连接,笔画的形态和长短粗细各有不同,即使相同字体之间,笔画与笔画之间、部件与部件之间相对位置甚至笔画的倾斜角度也会发生变化。
目前的笔画提取方法大多根据汉字的骨架和汉字图像的轮廓,应用最广泛的方法是通过图像细化算法得到图像骨架,根据图像领域的PBOD曲线找出笔画交叉点,再根据笔画之间的连接关系将笔画交叉分离,最后利用图像的轮廓和标准库的笔画部件等信息,将分离后的骨架复原为完整的笔画,进而完成汉字的笔画提取。
目前的传统笔画提取方法设计的规则复杂,只利用到很局限的骨架和轮廓等特征,人为确定的参数阈值过多,同时对于复杂汉字的提取效果很不理想,在正确率和效率上都没能达到令人满意的效果。
发明内容
本发明的主要目的在于克服现有技术的缺点与不足,提供一种基于MaskRCNN的汉字笔画分割提取方法及系统,用于解决笔画分割提取不准确,提取效率慢等问题。
本发明的第一目的在于提供一种基于MaskRCNN的汉字笔画分割提取方法。
本发明的第二目的在于提供一种基于MaskRCNN的汉字笔画分割提取系统。
本发明的第一目的通过以下的技术方案实现:
一种基于MaskRCNN的汉字笔画分割提取方法,包括以下步骤:
通过数据获取模块获取笔画分割数据,构成笔画分割数据集,并解析字体,生成训练集和验证集;
构建MaskRCNN网络模型,所述MaskRCNN模型包含主干网络、区域建议网络、分支网络;
预设MaskRCNN网络模型的初始参数和迭代次数,对训练集进行图像增强补充数据;
训练MaskRCNN网络模型,通过训练集更新网络参数,并通过验证集选择最优参数并保存;
将待测汉字图像输入训练好的网络模型,得到笔画分割提取结果。
进一步地,所述通过数据获取模块获取笔画分割数据,构成笔画分割数据集,具体为:
解析汉字字体,通过第一字体生成训练集的汉字图像,通过第二字体生成验证集的常用汉字;
分别利用字体生成数据集的汉字图像,将笔画的标签分为横竖撇捺折五类,获取每个笔画的掩模,通过笔画掩模的包围矩形作为标记框;
根据汉字图像的标记数据:笔画掩模、包围矩形、笔画标签;生成json文件,json文件能被MaskRCNN算法直接调用。
进一步地,所述第一字体为楷体GB2312;所述第二字体为仿宋GB2312。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110347017.4/2.html,转载请声明来源钻瓜专利网。