[发明专利]自动识别系统中的代码定位方法有效
申请号: | 201410088665.2 | 申请日: | 2014-03-12 |
公开(公告)号: | CN103886554A | 公开(公告)日: | 2014-06-25 |
发明(设计)人: | 王好贤;黄建文 | 申请(专利权)人: | 王好贤 |
主分类号: | G06T5/00 | 分类号: | G06T5/00;G06T7/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 264209 山东省威海市哈尔*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明是一种自动代码识别系统中被识别代码的自动定位方法,采用Canny算子和Ostu最大类间方差法提取代码和背景,运用噪声处理技术去除背景噪声,运用倾斜角估计技术矫正代码倾斜,用于提高系统识别的速度和识别的精度,适合于复杂背景下的代码定位。 | ||
搜索关键词: | 自动识别 系统 中的 代码 定位 方法 | ||
【主权项】:
1.自动识别系统中的代码定位方法,其特征在于,该方法包括如下步骤: 第一步:获取含代码的图像I; 第二步:利用公式(1)从彩色图像得到灰度图像,R(x,y)、G(x,y)、B(x,y)为原始图像I中坐标(x,y)处像素点的三个通道值,Ig(x,y)为相应的灰度图像坐标(x,y)处像素点的灰度值,得到的灰度图像记为Ig,若I为灰度图像,则Ig=I; Ig(x,y)=0.2989×R(x,y)+0.5870×G(x,y)+0.1140×B(x,y) (1) 第三步:利用Canny算子对灰度图像进行边缘检测,Canny算子是图像边缘检测的常用算子,本发明采用matlab函数edge(Ig,’canny’)得到包含代码边缘的图像IT,有的边缘有可能是噪声干扰造成的伪边缘,需要将其消除; 第四步:按照公式(2)计算Ig中代码边缘处像素的局部对比度值,计算范围在以边缘像素坐标(x,y)为中心,M个像素长、N个像素宽的邻域; C(x,y)=[Igmax(x,y)-Igmin(x,y)]/[255-Igmin(x,y)+ε] (2) 其中,Igmax(x,y)为邻域内像素最大灰度值,Igmin(x,y)为邻域内像素最小灰度值,防止分母为0,分母部分添加了正常数ε; 第五步:按照公式(3)计算Ig中代码边缘处像素的自适应局部对比度值,将计算结果替换图像IT中相应位置处像素的值得到自适应局部对比度图像ICA; CCA(x,y)=αC(x,y)+(1-α)[Igmax(x,y)-Igmin(x,y)] (3) 其中,权重系数α按照公式(4)计算,γ为在[0,∞]范围内取值的参数,Std为灰度图像Ig的全局标准差; α=(Std/128)γ (4) 第六步:将ICA中边缘处像素分为两类,按照公式(5)计算阈值,(5)式是数据分类中常用的最大类间方差法;
其中,T为分类阈值,ICA中灰度值大于等于T的边缘像素是代码边缘点,小于T的作为噪声去掉,得到边缘图像IT1,其中,
为ICA中边缘像素灰度值的类间方差,
为总方差,能够使(5)式取值最大的T值就是TOstu;第七步:根据边缘图像IT,在Ig中按照公式(6)计算代码边缘处像素的邻域均值,将计算结果替换图像IT中相应位置处像素的值得到邻域均值图像IME;
其中,Bx,y是边缘像素坐标(x,y)的邻域,M,N是邻域的长宽尺寸,(m,n)为邻域内像素的坐标值; 第八步:根据纹理处像素的邻域均值,按照公式(5)计算的阈值,将IME中边缘像素分为两类,邻域均值大于等于T的作为代码的边缘点,小的一类作为噪声去除,得到边缘图像IT2; 第九步:将IT1和IT2对应位置像素点的值进行与运算得到新的边缘图像ITN,为进一步消除噪声影响,计算ITN中连通域的像素数,小于P个像素的连通域作为噪声去掉得到最终的边缘图像ITE; 第十步:在图像ITE中对代码边缘进行竖直方向定位及裁剪,对边缘图像进行横向投影,并进行高斯平滑得到平滑的投影直方图histh,计算直方图的均值meanh和标准差stdh,将直方图中小于
的部分置为0,此时直方图中大于0的部分会形成一个个峰,找相邻的两个宽度大于代码行高度的峰作为两行代码的竖直位置,在图像有倾斜或者两行代码中间部分噪声较大的情况下代码区域可能形成一个峰,所以当存在一个宽度大于Q倍代码行高度的峰值时,将此区域作为代码区域,根据峰的位置在竖直方向上裁剪出代码区域;第十一步:倾斜角估计,对裁剪出的代码区域进行倾斜角估计,由于第十步中可以裁剪掉一部分噪声,并且裁剪后的图像像素点更少,此时进行倾斜角估计结果更加准确,速度更快,给定可能的倾斜范围maxA,以及需要的校正精度δA,从-maxA到maxA每间隔δA对图像进行一次旋转,对旋转后的图像进横向投影得到histhor,并计算histhor中非零值的均值,第i次旋转得到的结果记为Nmean(i),求
Nmean(i)最大时对应的旋转角度即为最终的倾斜校正角度;第十二步:根据第十一步估计出的倾斜角对ITE进行旋转,并按照第十步重新进行竖直方向定位及裁剪得到ITEH; 第十三步:水平方向定位,对ITEH进行垂直投影得到直方图histv,找出竖直方向投影的直方图histv中大于四分之一均值的部分作为代码区域,得到代码区域的水平位置。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于王好贤,未经王好贤许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410088665.2/,转载请声明来源钻瓜专利网。
- 上一篇:一种可以转向的电视机机架
- 下一篇:多功能电机入厂检测试验台