[发明专利]一种基于全局特征提取和训练的书法风格识别方法有效
申请号: | 201210280106.2 | 申请日: | 2012-08-07 |
公开(公告)号: | CN102842046A | 公开(公告)日: | 2012-12-26 |
发明(设计)人: | 张怡;刘彦镔;张加万;李罡 | 申请(专利权)人: | 天津大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 程毓英 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 全局 特征 提取 训练 书法 风格 识别 方法 | ||
技术领域
本发明属于书法字体分析技术领域,特别涉及到使用全局特征进行书法风格识别的方法。
背景技术
随着计算机数字图像处理技术的发展,数字处理技术已经代替了人工的方法用于书法字体的识别、创造和分析过程中。其中书法风格识别是书法分析的一个重要领域。现有的方法主要是使用基于笔画的方法进行书法分析和识别,主要的问题有以下几点:(1)笔画的建模和提取是个比较困难的工作,而且很容易造成笔画的失真现象;(2)基于笔画的方法会增加方法本身的复杂性,并且影响到系统整体的性能。因此我们提出了基于全局特征提取和统计训练的方法来处理具体的书法风格识别的问题。
发明内容
本发明针对传统的基于笔画特征的方法处理复杂、建模困难的问题,提出一种书法风格识别方法。本发明采取全局特征的提取,不仅降低了方法的复杂性,同时具有很高的识别率。本发明的技术方案如下:
一种基于全局特征提取和训练的书法风格识别方法,包括下列步骤:
第一步,获取对应不同单类风格的汉字的源数据图像,通过二值化的预处理方法得到输入的源数据图像的二值图像。
第二步,对于源数据图像的二值图像进行全局特征提取,得到位置特征、区域比例特征和投影特征三类特征,方法如下:
(1)找到二值图像中的文字部分的上下左右四个边缘位置,将由上下左右四个边缘位置组成的网格称为边缘格,提取出边缘格的长宽比和重心,并计算重心离几何中心的距离,得到位置特征向量;
(2)将边缘格由长宽边的中点划分为面积相等的左上、右上、左下、右下四个区域,提取不同区域含有的像素数目的比值和汉字像素占据边缘格的比例作为区域比例特征;
(3)将汉字像素在行方向或列方向进行投影,统计每行或每列的像素数目,提取出行和列的平均投影值、中间投影值和投影中心作为投影特征;
第三步,利用对不同单类风格的汉字的源数据图像提取的全局特征,训练SVM书法风格分类器;
第四步,对于待识别风格类型的汉字的源数据图像,通过二值化方法及高斯噪声去除的预处理方法得到输入的待识别风格类型的汉字的源数据图像的二值图像。
第五步,按照第二步给出的方法提取待识别风格类型的汉字的源数据图像的二值图像的全局特征;
第六步,利用训练好的分类器进行汉字风格识别。
作为优选实施方式,按照下面的方法提取出行和列的平均投影值、中间投影值和投影中心作为投影特征:
对于行方向,定义所有行的投影像素数目和除以行数为行平均投影阈值,所有行的投影像素数目的最大值和最小值取平均得到行中间投影阈值,则行方向的平均投影值就是行投影像素数目超过行平均投影阈值的行数,行方向的中间投影值就是行投影像素数目超过中间投影阈值的行数;将各行的投影像素数目进行递增排序,取出排序后位于中间的行的投影像素数目值,为行方向的投影中心;
对于列方向,定义所有列的投影像素数目和除以列数为列平均投影阈值,所有列的投影像素数目的最大值和最小值取平均得到列中间投影阈值,则列方向的平均投影值就是列投影像素数目超过列平均投影阈值的列数,列方向的中间投影值就是列投影像素数目超过中间投影阈值的列数;将各列的投影像素数目进列递增排序,取出排序后位于中间的列的投影像素数目值,为列方向的投影中心。
本发明的有益效果如下:
本发明解决的是书法风格识别的问题,整个系统的效用和性能主要受提取的字体特征、字体的规范化程度的影响。我们进行了基本实验和扩展实验来分别研究这两个因素的影响。在实验中,我们采用下面两个指标来衡量不同的因素对于识别结果的影响:
查全率:系统正确筛选出的某种风格字体的数量占测试集中该类字体实际的数量的比例;
查准率:系统正确筛选出的某种风格字体的数量占系统筛选出的该类字体的总数量的比例。
在基本实验中,我们选用方正字库的正规字体,并且将字体的全局特征分为位置特征、区域比例特征和投影特征。对于同种字体的某项特征进行实验的过程中,我们发现不同的汉字存在相似性和一致性的趋势和规律;而对于不同字体的同种特征,则存在明显的差异性。因此,我们将这三类全局特征放入SVM进行训练,使用正规字体测试集进行测试。实验结果表明,对于两类分类无论查准率和查全率都已经超过了90%,对于多类分类,两个指标也都超过了84%。这也说明了我们的系统有非常好的准确率和性能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210280106.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种提高畜禽采食量的口服液制剂及其制备方法
- 下一篇:植物甾醇片及其制备方法