[发明专利]一种手写表格的智能识别方法及系统有效
申请号: | 201410586463.0 | 申请日: | 2014-10-27 |
公开(公告)号: | CN104484643B | 公开(公告)日: | 2018-05-29 |
发明(设计)人: | 董兰芳;谢永祥 | 申请(专利权)人: | 中国科学技术大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20;G06K9/66 |
代理公司: | 北京凯特来知识产权代理有限公司 11260 | 代理人: | 郑立明;郑哲 |
地址: | 230026 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种手写表格的智能识别方法及系统,其中,该方法包括:对拍摄到的手写表格图片进行预处理后,依次进行差分处理及霍夫hough变换,获得角度校正后的手写表格图片;对所述角度校正后的手写表格图片进行分割,获得包含手写部分的若干个矩形区域;基于特征或分类器对所述若干个矩形区域中内容进行分析与识别。通过采用本发明公开的方法及系统,能够快速且准确的对手写表格进行识别。 | ||
搜索关键词: | 手写 角度校正 矩形区域 智能识别 预处理 差分处理 分类器 图片 拍摄 分割 分析 | ||
【主权项】:
1.一种手写表格的智能识别方法,其特征在于,该方法包括:对拍摄到的手写表格图片进行预处理后,依次进行差分处理及霍夫hough变换,获得角度校正后的手写表格图片;对所述角度校正后的手写表格图片进行分割,获得包含手写部分的若干个矩形区域;基于特征或分类器对所述若干个矩形区域中内容进行分析与识别;其中,对所述角度校正后的手写表格图片进行分割,获得包含手写部分的若干个矩形区域包括:对角度校正后的手写表格图片进行多次竖直方向的差分处理,获得差分处理后的图片G1;对所述图片G1进行水平方向的投影,获得数组P1;分别从数组P1的开始处和结尾处往中间搜索,找到第一个大于width/2的极大值,并作为表格整体的上下边界,标记其位置为y0与y1;其中,width表示图片G1的宽度;对角度校正后的手写表格图片进行水平方向的差分处理,获得差分处理后的图片G2;对所述图片G2进行竖直方向的投影,获得数组P2;分别从数组P2的开始处和结尾处往中间搜索,找到第一个大于height/2的极大值,并作为表格整体的左右边界,标记其位置为x0与x1;其中,height表示图片G2的高度;利用获得的位置x0、x1、y0与y1分割所述图片G1,获得完整的手写表格图片G3;根据先验知识,获得所述手写表格图片中需要人手工填写部分的行数L与列数C;对所述图片G3进行水平方向投影,获得数组P3,从后处往前查找,依次找出前L+1个值大于width/4的极大值并记录入数组Q1中;对所述图片G3进行竖直方向投影,获得数组P4,从后处往前查找,依次找出前C+1个值大于height/4的极大值并记录入数组Q2中;其中,所述数组Q1与数组Q2包含表格手写部分的所有直线位置,共L+1条和C+1条直线;对于手写部分的第i行与第j列,其矩形的四个点坐标为(Q1[i-1],Q2[j-1]);(Q1[i-1],Q2[j]);(Q1[i],Q2[j-1]);(Q1[i+1],Q2[j+1]);对于手写部分的矩形分布,在四个坐标的基础上往里缩进n个像素点距离,依次提取出L×C个矩形区域Gij 。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410586463.0/,转载请声明来源钻瓜专利网。