[发明专利]一种基于流形学习的汉字笔画自动提取方法有效

专利信息
申请号: 201710181667.X 申请日: 2017-03-24
公开(公告)号: CN107092917B 公开(公告)日: 2020-06-02
发明(设计)人: 陈旭东;连宙辉;唐英敏;肖建国 申请(专利权)人: 北京大学
主分类号: G06K9/46 分类号: G06K9/46
代理公司: 北京万象新悦知识产权代理有限公司 11360 代理人: 贾晓玲
地址: 100871*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 流形 学习 汉字 笔画 自动 提取 方法
【权利要求书】:

1.一种基于流形学习的汉字笔画自动提取方法,包括如下步骤:

A目标汉字图片输入;

B.构造汉字骨架流形,具体步骤包括:

B1.选取不同字体的字形二值图,离线提取出每一个字中每一个笔画的骨架上的关键点;

B2.离线搭建标准汉字笔画模型库,通过人工标注得到每一类笔画的骨架,以及骨架上的关键点;

B3.对于B1中每一个字形的每一个笔画,找到B2中的标准笔画模型库中对应的笔画模型,将B1中的笔画骨架上的关键点与B2中的标准笔画对应的骨架上的关键点进行点集注册操作,然后根据点集注册结果得到B1中每个笔画骨架上的关键点;

B4.将B1中每个笔画的骨架在相邻的关键点之间均匀采样,以保证骨架点的个数与B2中的标准笔画模型中骨架点的个数一致,从而B1中不同字体的同一个汉字字符对应字形的笔画骨架点彼此之间一一对应,并且也和B2中的标准笔画模型库的骨架点一一对应;

B5.由于满足一一对应关系,对于每一个字符构造一个矩阵,首先将B1中每一个字形图片大小都归一化至500*500,然后每一个字体对应的字形笔画骨架点按笔顺放在一起作为该矩阵中的一个行向量,上述矩阵中每一行表示一种字体风格,每一列表示不同字体之间一一对应的每一个笔画骨架点;

B6.将该矩阵作为训练数据进行流行学习,得到汉字骨架流形;

C从汉字骨架流形中寻找与目标汉字相似的字形作为参考字;具体步骤包括:

C1.预处理,即先将目标汉字归一化,再通过细化算法得到其骨架;

C2.计算目标汉字和流形中已有字体的骨架方向网格特征,然后计算特征相似度;

C3.选取特征相似度最大的字体作为流形中遍历的起点,在该点附近不断遍历,并计算遍历的每一个由流形生成的新的字形骨架与目标汉字的骨架方向网格特征相似度,遍历完毕后选取特征相似度最大的作为参考字;

D对目标汉字和参考字进行骨架点的点集注册,提取出目标汉字每一个笔画的骨架;

E通过提取目标汉字对应的轮廓,并填充轮廓得到目标汉字的笔画;

步骤中用Canny算子提取出目标字形的轮廓点,对于每一个轮廓点,计算与它距离最近的骨架点,并标注上同一个笔画标签,得到笔画对应的轮廓。

2.如权利要求1所述的基于流形学习的汉字笔画自动提取方法,其特征在于,步骤D的实现方法为:

D1.采用二次或三次插值算法,将C中找到的参考字缩放到目标汉字的尺寸;

D2.采用CPD算法,将参考字与目标汉字的骨架点进行非刚性点集注册操作;

D3.由于参考字每一个笔画的骨架点已知,根据D2中的点集注册结果将目标字中与参考字相匹配的骨架点归属到对应的笔画上去,进而根据骨架点的标签提取出每一个笔画的骨架点。

3.如权利要求1所述的基于流形学习的汉字笔画自动提取方法,其特征在于,步骤B3中采用一致性点集漂移算法,将B1中的笔画骨架上的关键点与B2中的标准笔画对应的骨架上的关键点进行点集注册操作。

4.如权利要求1所述的基于流形学习的汉字笔画自动提取方法,其特征在于,步骤B6中将该矩阵输入到GP-LVM模型中进行降维操作,最终降到二维空间。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710181667.X/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top