[发明专利]基于SIFT特征与灰度差值直方图特征的文字识别方法有效
申请号: | 200910052141.7 | 申请日: | 2009-05-27 |
公开(公告)号: | CN101561866A | 公开(公告)日: | 2009-10-21 |
发明(设计)人: | 陈凯;管海兵;金贞;武桐;郑琪 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46 |
代理公司: | 上海交达专利事务所 | 代理人: | 王锡麟;王桂忠 |
地址: | 200240*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 sift 特征 灰度 差值 直方图 文字 识别 方法 | ||
1.一种基于SIFT特征与灰度差值直方图特征的文字识别方法,其特征在于,包括以下步骤:
(1)建立汉字模板图库;
(2)提取待识别汉字图片的特征点,记录每个特征点的位置信息、邻域尺度信息、主方向信息,并计算出SIFT特征点的128维向量;
(3)利用步骤(2)中得到的每个特征点的位置信息、邻域尺度信息、主方向信息,计算两倍邻域尺度范围内灰度差值统计直方图,得到120维向量;
(4)将特征点的128维向量和120维向量合并在一起,归并成总的特征向量,得到待识别汉字图片的特征向量;
(5)对模板图库中模板文字进行特征向量的计算,并存于数据库中;
(6)将待识别汉字图片的特征向量与模板图库中模板文字图片的特征向量进行匹配,寻找与待识别汉字图片的特征向量相匹配的特征点;
(7)对识别到的汉字图像进行相似度排序,检测识别效果;
所述计算两倍邻域尺度范围内灰度差值统计直方图,是指:
1)以步骤(2)检测到的特征点为中心特征点,以邻域尺度的两倍大小为半径确定统计灰度差值的邻域范围;
2)将邻域范围旋转一个角度,使主方向与坐标系X轴正方向的夹角为0;
3)将半径量化为5级,将360度等分成12级,从而将邻域划分成60个子区域;
4)计算中心特征点与各个子邻域内其他像素点的差值,若得到的差值大于0,则将正差值的像素个数累加1,若得到的差值小于0,则将负差值的像素个数累加1,形成2维的统计直方图;
5)循环步骤4),直至计算完所有的子区域,得到60个子区域对应的120维向量。
2.根据权利要求1所述的基于SIFT特征与灰度差值直方图特征的文字识别方法,其特征是,所述的待识别汉字图片的特征向量与模板图库中模板文字图片的特征向量进行匹配,是指,遍历模板图库中模板文字图片的每个特征点,计算每个特征点对应的特征向量与待识别汉字图片所有特征向量的欧式距离,若最近邻距离与次近邻距离之比在阈值范围之内,则认为该特征点与最近邻向量所对应的特征点是匹配点对。
3.根据权利要求1所述的基于SIFT特征与灰度差值直方图特征的文字识别方法,其特征是,步骤(7)所述检测,是指,根据正确匹配点对数的统计结果以及特征向量间的相似度,将步骤(6)得到的结果通过加权排序的方法,得到模板图中与待识别汉字相匹配的汉字。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910052141.7/1.html,转载请声明来源钻瓜专利网。