[发明专利]一种基于傅氏频谱的汉字图像纹理特征提取方法无效
申请号: | 200910089570.1 | 申请日: | 2009-07-24 |
公开(公告)号: | CN101615195A | 公开(公告)日: | 2009-12-30 |
发明(设计)人: | 黄祥林;张洁;吕锐;杨丽芳;吕慧 | 申请(专利权)人: | 中国传媒大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06T7/40 |
代理公司: | 北京思海天达知识产权代理有限公司 | 代理人: | 张 慧 |
地址: | 100024*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 频谱 汉字 图像 纹理 特征 提取 方法 | ||
1.一种基于傅氏频谱的汉字图像纹理特征提取方法,具体方法步骤为:
首先,检索系统事先离线对中文文档图像库中的所有图像进行预处理和特征提取,得到库中所有汉字图像的特征向量,形成图像的特征向量库;然后再由用户输入待查询汉字图像,检索系统对查询图像按照与图像库中的汉字图像相同的处理方法进行预处理和特征提取,获取查询图像的特征向量,并将查询图像的特征向量和图像特征向量库中的特征向量进行相似度匹配,将与查询图像最相似的汉字图像返回给用户;其特征在于:
所述的将汉字图像进行特征提取的具体方法如下:
首先对单个汉字图像进行预处理,然后对其进行基于傅氏频谱的纹理特征提取,其提取步骤如下:
1)求取汉字图像的质心位置,利用图像的0阶矩m00和1阶矩(m10,m01)进行质心(ic,jc)的计算:
ic=m10/m00,jc=m01/m00
其中:M,N表示图像包含M行N列的像素点,i,j为像素点所在的行数和列数,f(i,j)是图像在(i,j)点的像素值,mpq是p+q阶矩;当p,q分别取0和1时得到图像的0阶矩m00和1阶矩(m10,m01),ic和jc分别表示图像质心点所在的行数和列数;
2)以汉字图像的质心为原点,建立x,y轴,以x,y为对称轴,将汉字图像分为四个部分,即左上、左下、右上和右下;然后对每个部分分别进行傅氏变换,得到四个傅里叶变换频谱图;
3)从步骤2)中得到的四个频谱图中任选一个,以所选频谱图的中心为原点,建立x′,y′轴,先对该频谱图分别进行二值化和细化处理,然后再将频谱图转换为弧度直方图,并对弧度直方图进行处理,得到汉字的笔划方向特征集合,具体步骤如下:
i)统计频谱图x′轴下方的白色像素点相对于x′轴正向的角度,以角度为横轴,每个角度之间间隔为1°,以处于该角度的所有白色像素点的像素值之和为纵轴,构成[0,180)°弧度直方图;
ii)将[0,180)°弧度直方图中的角度按处于该角度的白色像素值之和的大小进行排序,得到前十个较大的白色像素值之和以及所在的角度;求得以这些角度为0点的[-5,5]°范围内的所有白色像素值之和,如果在这十个中有角度互相包含在另一个角度的[-5,5]°范围之内,则按较大的角度为准,舍弃较小角度的求和;
iii)当步骤ii)筛选得到的白色像素值之和小于765,则放弃该角度,否则选取该角度;最后筛选得到的白色像素值所对应的角度构成笔划方向特征集合;
4)对步骤3)中得到的汉字笔划方向特征集合中的角度值进行量化处理:设定四个向量h=[h0,h1,h2],v=[v0,v1,v2],lf=[lf0,lf1,lf2],rf=[rf0,rf1,rf2]分别用来存储方向集合中的横、竖、撇、捺的信息;
当步骤iii)中筛选得到的角度值有落在[0,15]°或[165,180)°范围内时,则v1设置为1,否则为0;当有角度值落在(15,20)°范围内,v2设置为1,否则为0;当有角度值落在[20,25)°范围内,lf0设置为1,否则为0;当有角度值落在[25,65]°范围内,lf1设置为1,否则为0;当有角度值落在(65,70)°范围内,lf2设置为1,否则为0;当有角度值落在[70,75)°范围内,h0设置为1,否则为0;当有角度值落在[75,103]°范围内,h1设置为1,否则为0;当有角度值落在(103,108)°范围内,h2设置为1,否则为0;当有角度值落在[108,115)°范围内,rf0设置为1,否则为0;当有角度值落在[115,150]°范围内,rf1设置为1,否则为0;当有角度值落在(150,158)°范围内,rf2设置为1,否则为0;当有角度值落在[158,165)°范围内,v0设置为1,否则为0;
5)设H,V,LF,RF分别为步骤3)中所选部分的四个向量的分量和,即H=h0+h1+h2,V=v0+v1+v2,LF=lf0+lf1+lf2,RF=rf0+rf1+rf2;将步骤4)求得的数值代入上式,得到四个向量值;
设待检索的汉字图像的向量下标为Ⅰ,图像库中的汉字图像的向量下标为Ⅱ;又r=[r0,r1,r2,r3],其中
6)则该部分比较结果R=r0+r1+r2+r3,当R>2.5时,则重复步骤3)~步骤5),对步骤2)划分的汉字的其余部分继续进行相似性匹配,只有步骤2)划分的四部分同时满足R>2.5才认为相匹配;否则,认为不匹配,对图像库中其他汉字图像进行检索。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国传媒大学,未经中国传媒大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910089570.1/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序