[发明专利]一种基于流形学习的汉字笔画自动提取方法有效

专利信息
申请号: 201710181667.X 申请日: 2017-03-24
公开(公告)号: CN107092917B 公开(公告)日: 2020-06-02
发明(设计)人: 陈旭东;连宙辉;唐英敏;肖建国 申请(专利权)人: 北京大学
主分类号: G06K9/46 分类号: G06K9/46
代理公司: 北京万象新悦知识产权代理有限公司 11360 代理人: 贾晓玲
地址: 100871*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提供一种基于流形学习的汉字笔画自动提取方法,属于人工智能、计算机图形学领域。该方法通过构建汉字骨架的二维流形空间并从其中寻找风格最相似的字作为参考字来指导目标字的笔画提取。本发明可以解决基于数据驱动的笔画自动提取方法中参考字与目标字风格差异太大的问题,有效提高了汉字笔画提取的准确率。
搜索关键词: 一种 基于 流形 学习 汉字 笔画 自动 提取 方法
【主权项】:
一种基于流形学习的汉字笔画自动提取方法,包括如下步骤:A目标汉字图片输入;B.构造汉字骨架流形,具体步骤包括:B1.选取不同字体的字形二值图,离线提取出每一个字中每一个笔画的骨架上的关键点;B2.离线搭建标准汉字笔画模型库,通过人工标注得到每一类笔画的骨架,以及骨架上的关键点;B3.对于B1中每一个字形的每一个笔画,找到B2中的标准笔画模型库中对应的笔画模型,将B1中的笔画骨架上的关键点与B2中的标准笔画对应的骨架上的关键点进行点集注册操作,然后根据点集注册结果得到B1中每个笔画骨架上的关键点;B4.将B1中每个笔画的骨架在相邻的关键点之间均匀采样,以保证骨架点的个数与B2中的标准笔画模型中骨架点的个数一致,从而B1中不同字体的同一个汉字字符对应字形的笔画骨架点彼此之间一一对应,并且也和B2中的标准笔画模型库的骨架点一一对应;B5.由于满足一一对应关系,对于每一个字符构造一个矩阵,首先将B1中每一个字形图片大小都归一化至500*500,然后每一个字体对应的字形笔画骨架点按笔顺放在一起作为该矩阵中的一个行向量,上述矩阵中每一行表示一种字体风格,每一列表示不同字体之间一一对应的每一个笔画骨架点;B6.将该矩阵作为训练数据进行流行学习,得到汉字骨架流形;C从汉字骨架流形中寻找与目标汉字相似的字形作为参考字;D对目标汉字和参考字进行骨架点的点集注册,提取出目标汉字每一个笔画的骨架;E通过提取目标汉字对应的轮廓,并填充轮廓得到目标汉字的笔画。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201710181667.X/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top