[发明专利]一种基于MaskRCNN的汉字笔画分割提取方法及系统在审

专利信息
申请号: 202110347017.4 申请日: 2021-03-31
公开(公告)号: CN113011431A 公开(公告)日: 2021-06-22
发明(设计)人: 许勇;谭艳鸿 申请(专利权)人: 华南理工大学
主分类号: G06K9/34 分类号: G06K9/34;G06K9/62;G06K9/00;G06N3/08;G06N3/04
代理公司: 广州市华学知识产权代理有限公司 44245 代理人: 李君
地址: 510640 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 maskrcnn 汉字 笔画 分割 提取 方法 系统
【说明书】:

发明公开了一种基于MaskRCNN的汉字笔画分割提取方法,包括以下步骤:构成笔画分割数据集,并解析字体,生成训练集和验证集;构建MaskRCNN网络模型,所述MaskRCNN网络模型包含骨干网络、区域建议网络、分支网络;预设MaskRCNN网络模型的初始参数和迭代次数,对训练集进行图像增强补充数据;训练MaskRCNN网络模型,通过训练集更新网络参数,并通过验证集选择最优参数并保存;将待测汉字图像输入训练好的网络模型,得到笔画分割提取结果;本发明创新地利用实例分割领域Mask RCNN算法于汉字的笔画分割提取任务中,对比笔画提取的方法,处理效果和效率大幅度提升。

技术领域

本发明涉及图像分割的研究领域,特别涉及一种基于MaskRCNN的汉字笔画分割提取方法及系统。

背景技术

汉字是世界上最古老的文字之一,是我国文化得以生生不息的基础,而笔画是汉字的组成部分,研究汉字的结构构成、识别等离不开笔画,而汉字的笔画自动分割和提取是一个重要且挑战性的任务。汉字笔画分割提取的挑战性主要体现在汉字结构复杂,不同字体的笔画连接,笔画的形态和长短粗细各有不同,即使相同字体之间,笔画与笔画之间、部件与部件之间相对位置甚至笔画的倾斜角度也会发生变化。

目前的笔画提取方法大多根据汉字的骨架和汉字图像的轮廓,应用最广泛的方法是通过图像细化算法得到图像骨架,根据图像领域的PBOD曲线找出笔画交叉点,再根据笔画之间的连接关系将笔画交叉分离,最后利用图像的轮廓和标准库的笔画部件等信息,将分离后的骨架复原为完整的笔画,进而完成汉字的笔画提取。

目前的传统笔画提取方法设计的规则复杂,只利用到很局限的骨架和轮廓等特征,人为确定的参数阈值过多,同时对于复杂汉字的提取效果很不理想,在正确率和效率上都没能达到令人满意的效果。

发明内容

本发明的主要目的在于克服现有技术的缺点与不足,提供一种基于MaskRCNN的汉字笔画分割提取方法及系统,用于解决笔画分割提取不准确,提取效率慢等问题。

本发明的第一目的在于提供一种基于MaskRCNN的汉字笔画分割提取方法。

本发明的第二目的在于提供一种基于MaskRCNN的汉字笔画分割提取系统。

本发明的第一目的通过以下的技术方案实现:

一种基于MaskRCNN的汉字笔画分割提取方法,包括以下步骤:

通过数据获取模块获取笔画分割数据,构成笔画分割数据集,并解析字体,生成训练集和验证集;

构建MaskRCNN网络模型,所述MaskRCNN模型包含主干网络、区域建议网络、分支网络;

预设MaskRCNN网络模型的初始参数和迭代次数,对训练集进行图像增强补充数据;

训练MaskRCNN网络模型,通过训练集更新网络参数,并通过验证集选择最优参数并保存;

将待测汉字图像输入训练好的网络模型,得到笔画分割提取结果。

进一步地,所述通过数据获取模块获取笔画分割数据,构成笔画分割数据集,具体为:

解析汉字字体,通过第一字体生成训练集的汉字图像,通过第二字体生成验证集的常用汉字;

分别利用字体生成数据集的汉字图像,将笔画的标签分为横竖撇捺折五类,获取每个笔画的掩模,通过笔画掩模的包围矩形作为标记框;

根据汉字图像的标记数据:笔画掩模、包围矩形、笔画标签;生成json文件,json文件能被MaskRCNN算法直接调用。

进一步地,所述第一字体为楷体GB2312;所述第二字体为仿宋GB2312。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110347017.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top