[发明专利]一种基于傅氏频谱的汉字图像纹理特征提取方法无效

专利信息
申请号: 200910089570.1 申请日: 2009-07-24
公开(公告)号: CN101615195A 公开(公告)日: 2009-12-30
发明(设计)人: 黄祥林;张洁;吕锐;杨丽芳;吕慧 申请(专利权)人: 中国传媒大学
主分类号: G06F17/30 分类号: G06F17/30;G06T7/40
代理公司: 北京思海天达知识产权代理有限公司 代理人: 张 慧
地址: 100024*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明是一种基于傅氏频谱的汉字图像纹理特征的提取方法,属于多媒体检索领域。本发明是对单个汉字图像进行特征向量提取。在进行特征向量提取的过程中,首先计算出单个汉字图像的质心的相对位置,将汉字以质心为中心点划分为四个部分;再对每个部分进行傅氏变换,得到该部分的傅氏频谱图;接着利用傅氏频谱图的方向性,获取每个部分汉字图像的笔画角度集合;最后对这些角度集合进行量化,得到汉字图像的特征向量。本发明通过对汉字图像的质心分割,对各个部分进行傅氏频谱的特征提取,忽略了汉字图像在结构上的微小畸变,降低汉字字体的影响,能够提高汉字图像的检索效率。
搜索关键词: 一种 基于 频谱 汉字 图像 纹理 特征 提取 方法
【主权项】:
1、一种基于傅氏频谱的汉字图像纹理特征提取方法,具体方法步骤为:首先,检索系统事先离线对中文文档图像库中的所有图像进行预处理和特征提取,得到库中所有汉字图像的特征向量,形成图像的特征向量库;然后再由用户输入待查询汉字图像,检索系统对查询图像按照与图像库中的汉字图像相同的处理方法进行预处理和特征提取,获取查询图像的特征向量,并将查询图像的特征向量和图像特征向量库中的特征向量进行相似度匹配,将与查询图像最相似的汉字图像返回给用户;其特征在于:所述的将汉字图像进行特征提取的具体方法如下:首先对单个汉字图像进行预处理,然后对其进行基于傅氏频谱的纹理特征提取,其提取步骤如下:1)求取汉字图像的质心位置,利用图像的0阶矩(m00)和1阶矩(m10,m01)进行质心(ic,jc)的计算:mpq=Σj=1NΣi=1Mipjqf(i,j),]]>ic=m10/m00,jc=m01/m00.其中:M,N表示图像包含M行N列的像素点,i,j为像素点所在的行数和列数,f(i,j)是图像在(i,j)点的像素值,mpq是p+q阶矩;当p,q分别取0和1时得到图像的0阶矩(m00)和1阶矩(m10,m01),ic和jc分别表示图像质心点所在的行数和列数;2)以汉字图像的质心为原点,建立x,y轴,以x,y为对称轴,将汉字图像分为四个部分,即左上、左下、右上和右下;然后对每个部分分别进行傅氏变换,得到四个傅里叶变换频谱图;3)从步骤2)中得到的四个频谱图中任选一个,以所选频谱图的中心为原点,建立x′,y′轴,先对该频谱图分别进行二值化和细化处理,然后再将频谱图转换为弧度直方图,并对弧度直方图进行处理,得到汉字的笔划方向特征集合,具体步骤如下:i)统计频谱图x′轴下方的白色像素点相对于x′轴正向的角度,以角度为横轴,每个角度之间间隔为1°,以处于该角度的所有白色像素点的像素值之和为纵轴,构成[0,180)°弧度直方图;ii)将[0,180)°弧度直方图中的角度按处于该角度的白色像素值之和的大小进行排序,得到前十个较大的白色像素值之和以及所在的角度;求得以这些角度为0点的[-5,5]°范围内的所有白色像素值之和,如果在这十个中有角度互相包含在另一个角度的[-5,5]°范围之内,则按较大的角度为准,舍弃较小角度的求和;iii)当步骤ii)筛选得到的白色像素值之和小于765,则放弃该角度,否则选取该角度;最后筛选得到的白色像素值所对应的角度构成笔划方向特征集合;4)对步骤3)中得到的汉字笔划方向特征集合中的角度值进行量化处理:设定四个向量h=[h0,h1,h2],v=[v0,v1,v2],lf=[lf0,lf1,lf2],rf=[rf0,rf1,rf2]分别用来存储方向集合中的横、竖、撇、捺的信息;当步骤iii)中筛选得到的角度值有落在[0,15]°范围内的,则v1设置为1,否则为0;当有角度值落在(15,20)°范围内,v2设置为1,否则为0;当有角度值落在[20,25)°范围内,lf0设置为1,否则为0;当有角度值落在[25,65]°范围内,lf1设置为1,否则为0;当有角度值落在(65,70)°范围内,lf2设置为1,否则为0;当有角度值落在[70,75)°范围内,h0设置为1,否则为0;当有角度值落在[75,103]°范围内,h1设置为1,否则为0;当有角度值落在(103,108)°范围内,h2设置为1,否则为0;当有角度值落在[108,115)°范围内,rf0设置为1,否则为0;当有角度值落在[115,150]°范围内,rf1设置为1,否则为0;当有角度值落在(150,158)°范围内,rf2设置为1,否则为0;当有角度值落在[158,165)°范围内,v0设置为1,否则为0;当有角度值落在[165,180)°范围内,v1设置为1,否则为0;5)设H,V,LF,RF分别为步骤3)中所选部分的四个向量的分量和,即H=h0+h1+h2,V=v0+v1+v2,LF=lf0+lf1+lf2,RF=rf0+rf1+rf2;将步骤4)求得的数值代入上式,得到四个向量值;设待检索的汉字图像的向量下标为I,图像库中的汉字图像的向量下标为II;又r=[r0,r1,r2,r3],其中6)则该部分比较结果R=r0+r1+r2+r3,当R>2.5时,则重复步骤3)~步骤5),对步骤2)划分的汉字的其余部分继续进行相似性匹配,只有步骤2)划分的四部分同时满足R>2.5才认为相匹配;否则,认为不匹配,对图像库中其他汉字图像进行检索。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国传媒大学,未经中国传媒大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/200910089570.1/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top