[发明专利]一种手写表格的智能识别方法及系统有效
申请号: | 201410586463.0 | 申请日: | 2014-10-27 |
公开(公告)号: | CN104484643B | 公开(公告)日: | 2018-05-29 |
发明(设计)人: | 董兰芳;谢永祥 | 申请(专利权)人: | 中国科学技术大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20;G06K9/66 |
代理公司: | 北京凯特来知识产权代理有限公司 11260 | 代理人: | 郑立明;郑哲 |
地址: | 230026 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 手写 角度校正 矩形区域 智能识别 预处理 差分处理 分类器 图片 拍摄 分割 分析 | ||
1.一种手写表格的智能识别方法,其特征在于,该方法包括:
对拍摄到的手写表格图片进行预处理后,依次进行差分处理及霍夫hough变换,获得角度校正后的手写表格图片;
对所述角度校正后的手写表格图片进行分割,获得包含手写部分的若干个矩形区域;
基于特征或分类器对所述若干个矩形区域中内容进行分析与识别;
其中,对所述角度校正后的手写表格图片进行分割,获得包含手写部分的若干个矩形区域包括:
对角度校正后的手写表格图片进行多次竖直方向的差分处理,获得差分处理后的图片G1;对所述图片G1进行水平方向的投影,获得数组P1;分别从数组P1的开始处和结尾处往中间搜索,找到第一个大于width/2的极大值,并作为表格整体的上下边界,标记其位置为y0与y1;其中,width表示图片G1的宽度;
对角度校正后的手写表格图片进行水平方向的差分处理,获得差分处理后的图片G2;对所述图片G2进行竖直方向的投影,获得数组P2;分别从数组P2的开始处和结尾处往中间搜索,找到第一个大于height/2的极大值,并作为表格整体的左右边界,标记其位置为x0与x1;其中,height表示图片G2的高度;
利用获得的位置x0、x1、y0与y1分割所述图片G1,获得完整的手写表格图片G3;
根据先验知识,获得所述手写表格图片中需要人手工填写部分的行数L与列数C;对所述图片G3进行水平方向投影,获得数组P3,从后处往前查找,依次找出前L+1个值大于width/4的极大值并记录入数组Q1中;对所述图片G3进行竖直方向投影,获得数组P4,从后处往前查找,依次找出前C+1个值大于height/4的极大值并记录入数组Q2中;其中,所述数组Q1与数组Q2包含表格手写部分的所有直线位置,共L+1条和C+1条直线;对于手写部分的第i行与第j列,其矩形的四个点坐标为(Q1[i-1],Q2[j-1]);(Q1[i-1],Q2[j]);(Q1[i],Q2[j-1]);(Q1[i+1],Q2[j+1]);
对于手写部分的矩形分布,在四个坐标的基础上往里缩进n个像素点距离,依次提取出L×C个矩形区域G
2.根据权利要求1所述的方法,其特征在于,所述对拍摄到的手写表格图片进行预处理后,依次进行差分处理及霍夫hough变换,获得角度校正后的手写表格图片包括:
对所述手写表格图片灰度化后,使用最大类间差法得到全局阈值,并进行二值化后,得到图片F1;
对所述图片F1进行竖直方向的差分,获得差分处理后的图片F2:
F2(i,j)=|F1(i+1,j)-F1(i,j)|;
利用hough变换对差分处理后的图片F2进行直线检测,获得图片F2中最长的N条直线的倾斜角度,并求得其平均值a;
利用双线性差值的方法对所述图片F1进行反方向旋转a度,得到角度校正后的手写表格图片。
3.根据权利要求1所述的方法,其特征在于,所述基于特征或分类器对所述若干个矩形区域中内容进行分析与识别包括:
对于手写符号,则通过分析符号的特征进行识别;
对于手写的文字内容,则利用支持向量机SVM分类器进行识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410586463.0/1.html,转载请声明来源钻瓜专利网。