[发明专利]一种基于流形学习的汉字笔画自动提取方法有效
申请号: | 201710181667.X | 申请日: | 2017-03-24 |
公开(公告)号: | CN107092917B | 公开(公告)日: | 2020-06-02 |
发明(设计)人: | 陈旭东;连宙辉;唐英敏;肖建国 | 申请(专利权)人: | 北京大学 |
主分类号: | G06K9/46 | 分类号: | G06K9/46 |
代理公司: | 北京万象新悦知识产权代理有限公司 11360 | 代理人: | 贾晓玲 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 流形 学习 汉字 笔画 自动 提取 方法 | ||
本发明提供一种基于流形学习的汉字笔画自动提取方法,属于人工智能、计算机图形学领域。该方法通过构建汉字骨架的二维流形空间并从其中寻找风格最相似的字作为参考字来指导目标字的笔画提取。本发明可以解决基于数据驱动的笔画自动提取方法中参考字与目标字风格差异太大的问题,有效提高了汉字笔画提取的准确率。
技术领域
本发明提供一种面向汉字的笔画自动提取算法,具体涉及字体骨架流形的建立,在流形中寻找与目标字形最相似的模板,以及根据模板对字形进行笔画自动提取,属于人工智能、计算机图形学领域。
背景技术
图形切分是计算机图形学和计算机视觉领域中最重要的研究问题之一。对于汉字字形而言,汉字是由笔画构成的,且笔画是组成汉字的最小基本单位,所以一个字形通常会按照笔画级别进行切分,汉字字形切分又被称为汉字笔画提取。汉字笔画提取技术是汉字识别、书写风格分析以及合成新字体等领域的关键步骤。然而,目前在学术界并没有很好地解决汉字笔画自动提取技术难题,主要原因在于汉字结构的复杂性以及多样性。一个复杂的汉字会有多个笔画交叉、粘连在一起,即使人工手动提取也会费时费力。
现有的汉字笔画自动提取技术基本可以分为两类:无监督方法和基于数据驱动的方法。在无监督方法中,Wang(WANG X.,LIANG X.,SUN L.,LIU M.:Triangular mesh basedstroke segmentation for chinese calligraphy.In Document Analysis andRecognition(ICDAR),2013 12th International Conference on(2013),IEEE,pp.1155–1159.)首先提取出字形的轮廓,然后将轮廓进行三角网格剖分,根据三角网格的不同特征得到模糊区域和小笔画段,最后通过分析笔画段之间的连通性将小笔画段连接成完整的笔画。无监督的笔画自动提取方法存在一个固有缺陷,就是只能提取简单笔画,无法提取出类似于竖弯钩这样的复杂笔画。而基于数据驱动的方法则通过使用参考笔画信息有效地解决了这个问题,并且能够保持笔画的原有顺序。Chen(CHEN X.,LIAN Z.,TANG Y.,XIAO J.:Abenchmark for stroke extraction of chinese characters.Acta ScientiarumNaturalium Universitatis Pekinensis(2016)),Lian(LIAN Z.,ZHAO B.,XIAO J.:Automatic generation of largescale handwriting fonts via style learning.InSIGGRAPH ASIA 2016Technical Briefs(2016),ACM),Wang(WANG C.,LIAN Z.,TANG Y.,XIAO J.:Automatic correspondence finding for Chinese characters using graphmatching.In Image and Graphics(ICIG),2013Seventh International Conference on(2013),IEEE,pp.545–550.)等人使用一套源自方正公司的含有独立笔画信息的GB2312楷体交叉字库作为参考模型,然后将参考字的骨架上的关键点和目标字的骨架上的关键点进行点集匹配,根据点集匹配结果提取出最终的笔画。
基于数据驱动的汉字笔画自动提取方法,其笔画提取结果的有效性很大程度上取决于骨架上的关键点的点集匹配准确率。然而字体风格多样,同一个字的结构和形状在不同字体中可能相差很大,导致点集匹配算法的准确率不高,使得现有的方法在处理与标准楷体风格相差很大的字体问题上效果不佳。
发明内容
本发明涉及的术语如下:
参考字:基于数据驱动的汉字笔画自动提取方法中,作为参考的汉字图像,包含其每一个笔画的图像和位置,以及每一个笔画对应的笔顺;
目标汉字:用户输入的汉字图像(二值图);
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710181667.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种输出轴生产用自动换向夹具
- 下一篇:一种新能源汽车配件正反面装夹加工工装