[发明专利]一种基于模板匹配实现快速页码识别的方法有效
申请号: | 201710899531.2 | 申请日: | 2017-09-28 |
公开(公告)号: | CN107766854B | 公开(公告)日: | 2021-07-06 |
发明(设计)人: | 陶冰洁;王酉祥;黄景雨;刘勇;李美惠;廖龙 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/34 |
代理公司: | 成都弘毅天承知识产权代理有限公司 51230 | 代理人: | 徐金琼;刘东 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 模板 匹配 实现 快速 页码 识别 方法 | ||
1.一种基于模板匹配实现快速页码识别的方法,其特征在于,包括以下步骤:
步骤1:待检测的页码图像f′(x,y)预处理得到待匹配页码图像fi′(x,y),判断是否存在页码数字模板,如存在页码数字模板,则跳过步骤2直接执行步骤3,如不存在页码数字模板,先执行步骤2再执行步骤3;
步骤2:所需的数字0-9的模版图像经过步骤1中所述的预处理得到M×N大小的页码数字模板gjk(x,y);
步骤3:判断待匹配页码图像fi′(x,y)是否存在粘连情况,如存在粘连情况,则将待检测页码图像fi′(x,y)高度拉伸至M同时宽度等比例拉伸后再进行分割,并经过排序后宽度加宽至N,得到分割后序列图像g′i(x,y)再继续执行步骤4,如没有存在粘连情况,则直接归一化处理得到M×N大小的待匹配页码图像fi′(x,y)再执行步骤4;
步骤4:将经过步骤3处理后的分割后序列图像g′i(x,y)或待匹配页码图像fi′(x,y)与页码数字模板gjk(x,y)进行匹配,得到对应数字xi,将对应数字xi依次排列得到页码图像f′(x,y)最终的页码值x1 x2 … xi;
步骤5:将页码图像f′(x,y)最终的页码值x1 x2 … xi与其前一页页码值x′1 x′2 …xi′进行对比验证:
x1 x2 … xi-x1′ x2′ … xi′=1
如满足上式,则说明页码识别正确;
所述步骤3具体为:
检测待匹配页码图像fi′(x,y)的宽度和高度,得到宽度与高度的比例值α,若α<1,则没有发生页码数字粘连,待匹配页码图像fi′(x,y)直接归一化处理得到M×N大小再执行步骤4;
若α>1,则存在页码数字粘连的情况,则将待匹配页码图像fi′(x,y)图像高度拉伸到统一的高度为M,宽度等比例拉伸,再将其从宽度方向正中间进行分割后从左到右进行排序,并宽度增加至N,最终得到分割后序列图像gi′(x,y),再继续执行步骤4;
所述步骤1的预处理具体为:
步骤1.1:选取页码位置符合要求的待检测书页原始图像读入初始图像f(x,y),将初始图像f(x,y)中的页码部分分割出来为页码图像f′(x,y),再转化为灰度图像f′gray(x,y);
步骤1.2:将步骤1处理得到的灰度图像f′gray(x,y)进行最小值滤波得到滤波后图像f′pre(x,y);
步骤1.3:将步骤2处理得到的滤波后图像f′pre(x,y)使用OTSU自动阈值分割法进行二值化得到二值化图像f′binary(x,y);
步骤1.4:将二值化图像f′binary(x,y)进行取反操作,提取单个数字字符的最小包含矩形得到待检测页码图像fi′(x,y);
所述步骤4具体为:
将分割后序列图像g′i(x,y)或待匹配页码图像fi(x,y)与数字模板gjk(x,y)进行匹配,对gjk(x,y)和分割后序列图像g′i(x,y)或待匹配页码图像fi(x,y)的对应点做相与,结果为1的点数目为A,再对gjk(x,y)和分割后序列图像g′i(x,y)或待匹配页码图像fi(x,y)的点做或运算,得到的值为0的点数目为B,最后得到gjk(x,y)和分割后序列图像g′i(x,y)或待匹配页码图像fi′(x,y)的匹配度ljk;
ljk=A+B
当匹配成功,则将fi′(x,y)识别为j0,分割后序列图像g′i(x,y)或待匹配页码图像fi′(x,y)页码对应数字xi=j0。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710899531.2/1.html,转载请声明来源钻瓜专利网。