[发明专利]字符识别处理方法及装置有效
申请号: | 201811382334.4 | 申请日: | 2018-11-20 |
公开(公告)号: | CN109558876B | 公开(公告)日: | 2021-11-16 |
发明(设计)人: | 贺三元;罗晗璐 | 申请(专利权)人: | 浙江口碑网络技术有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34 |
代理公司: | 北京市浩天知识产权代理事务所(普通合伙) 11276 | 代理人: | 宋菲;刘云贵 |
地址: | 310012 浙江省杭州市西*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字符 识别 处理 方法 装置 | ||
本发明公开了一种字符识别处理方法及装置,其中,字符识别处理方法包括:从待识别文件中提取待识别区域;对待识别区域进行连通域分析,得到多个连通域;根据多个连通域对应的字符参数信息,对多个连通域进行合并,得到连通域合并处理结果;按照连通域合并处理结果,对待识别区域内的字符识别结果进行组合或拆分,得到多个字符组。根据本发明提供的技术方案,实现了对识别出的字符的有效拆分,有效地提高了字符识别处理精度,而且充分利用了现有的字符识别算法所识别得到的字符识别结果,极大地节约了开发成本,提高了字符识别处理效率。
技术领域
本发明涉及字符识别技术领域,具体涉及一种字符识别处理方法及装置。
背景技术
现有技术中常用的字符识别算法包括OCR(光学字符识别,Optical CharacterRecognition)算法等,利用字符识别算法能够对图片、文档等文件中的字符进行自动识别,将文件中所有的字符识别出来。然而现有技术中的字符识别算法大多只能按行或列进行识别,不同字号、不同颜色和间隔较大的字符会被组合拼接成一段字符,无法对识别出的字符进行有效拆分,导致字符识别处理精度较低,无法很好地满足用户使用需求。
为解决字符识别精度低的问题,申请公布号为CN103854019A的中国专利申请提供了一种图像中的字段提取方法,该方法将文字区域的像素按颜色划分为若干个聚类,对文字区域的像素进行连通域分析,并对识别出的每个像素连通区域的像素设定对应该连通区域中的像素所属聚类的颜色,对像素连通区域进行文本行识别,将同在一个文本行中且颜色相同的像素连通区域判定为一个字段,从而能够按照颜色从文字区域中提取出字段。然而,采用该方法,需对现有的字符识别算法进行修改,提高了人工成本,降低了字符识别处理效率,而且该方法仅能够按照颜色拆分字符,没有很好地实现对字符的有效拆分,仍然存在着字符识别处理精度较低的问题。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的字符识别处理方法及装置。
根据本发明的一个方面,提供了一种字符识别处理方法,该方法包括:
从待识别文件中提取待识别区域;
对待识别区域进行连通域分析,得到多个连通域;
根据多个连通域对应的字符参数信息,对多个连通域进行合并,得到连通域合并处理结果;
按照连通域合并处理结果,对待识别区域内的字符识别结果进行组合或拆分,得到多个字符组。
进一步地,从待识别文件中提取待识别区域进一步包括:
对待识别文件进行字符识别处理得到字符识别结果,根据字符识别结果从待识别文件中提取待识别区域。
进一步地,对待识别区域进行连通域分析,得到多个连通域进一步包括:
利用种子填充算法对待识别区域进行连通域分析,得到多个初始连通域,针对每个初始连通域,获取该初始连通域的外接矩形;
依据多个外接矩形的参数信息,对多个初始连通域进行合并,得到多个连通域。
进一步地,利用种子填充算法对待识别区域进行连通域分析,得到多个初始连通域进一步包括:
利用最大类间方差算法对待识别区域进行二值化处理,得到二值图片;
利用种子填充算法对二值图片进行连通域分析,得到多个初始连通域。
进一步地,依据多个外接矩形的参数信息,对多个初始连通域进行合并,得到多个连通域进一步包括:
依据多个外接矩形的位置参数信息,判断多个外接矩形是否存在重叠区域;
若是,则将存在重叠区域的外接矩形对应的初始连通域进行合并。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江口碑网络技术有限公司,未经浙江口碑网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811382334.4/2.html,转载请声明来源钻瓜专利网。