[发明专利]文字区域定位方法和装置有效
| 申请号: | 201710152728.X | 申请日: | 2017-03-15 |
| 公开(公告)号: | CN108573251B | 公开(公告)日: | 2021-09-07 |
| 发明(设计)人: | 王永亮;王青泽;陈标龙 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
| 主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/46 |
| 代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 曹蓓 |
| 地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文字 区域 定位 方法 装置 | ||
本发明提出一种文字区域定位方法和装置,涉及图像处理领域。其中,本发明的一种文字区域定位方法包括:根据原始图像获取方差图;获取方差图的边缘图像;若边缘图像中相邻两条边缘线中位置相对的边缘点之间距离的差值在预定距离差范围内,则确定相邻两条边缘线之间的区域为文字区域。通过这样的方法,能够利用文字区域中文字高度相似的特点,根据边缘图像中边缘线之间的距离确定文字区域,不会由于文字笔画粗度变化造成影响,适用于各种不同的字体,且能够避免图像复杂的像素变化情况对定位造成影响,提高文字区域定位的准确性。
技术领域
本发明涉及图像处理领域,特别是一种文字区域定位方法和装置。
背景技术
在文字识别过程中,需要先利用某些算法在图片中定位出文字区域,再在文字区域中利用相关的图像算法提取文字内容,因此文字定位是文字识别引擎的一个重要的模块。目前常用的方法有笔画宽度定位法(Stroke Width Transform)和稳定极值区域检测法(Maximally Stable Extremal Regions)。
笔画宽度定位法利用打印体文字的笔画宽度不变这一特性,在一个图片中寻找一对平行线,并将平行线判定为笔画,再把相互靠近的笔画聚集成文字区域。图1为利用笔画宽度定位法进行文字定位的示意图。图1A的灰色区域是文字的一个笔画放大数倍之后的效果,其中灰色的小格子是笔画上的像素,白色的小格子是图像背景。图1B中,利用Canny算子勾勒出了笔画的两条轮廓,大致可以看出这两条轮廓相互平行,p和q为轮廓两侧相对的点,两点之间的直线距离为W。图1C是在图1B的基础上计算轮廓上的像素到与其平行的轮廓上的像素点最小的距离,这个距离就是笔画宽度。
稳定极值区域检测法是利用图像中的文字区域会跟背景图像形成鲜明的对比这一特点进行文字区域定位。如图2所示,图像中的字体跟背景的颜色对比明显,通过不断提高二值化阈值,可以获得右边的两张图片,在右边的图片中可以清晰的看到文字信息。
但是,现有技术也有各自的缺陷。如图3A中所示,微软正黑体的文字笔画的宽度是一致的,能够采用笔画宽度定位法进行定位,但是,如图3B中所示的宋体文字其笔画宽度并不相同,如笔画撇(丿)就是上半部分宽度比较粗,下边比较细,因此不适用于采用笔画宽度定位法进行定位。而采用稳定极值区域检测法需要文字区域的像素对比度高,但在应用过程中,对比度高的区域不一定是文字,因此该算法很容易引入额外的噪声。如图4所示,矩形框所选中的位置都是稳定极值区域,但是只有不到一半的区域是文字区域。另外,这两种方法都只能先定位文字区域,还需要额外的算法将单个文字串成行,较为繁琐,降低了运算效率。
发明内容
本发明的一个目的在于提出一种文字区域定位方法,提高对不同字体的适应能力,提高文字区域定位的准确性。
根据本发明的一个实施例,提出一种文字区域定位方法,包括:根据原始图像获取方差图;获取方差图的边缘图像;若边缘图像中相邻两条边缘线中位置相对的边缘点之间距离的差值在预定距离差范围内,则确定相邻两条边缘线之间的区域为文字区域。
可选地,若边缘图像中相邻两条边缘线中位置相对的边缘点之间距离的差值在预定距离差范围内,则确定相邻两条边缘点之间的区域为文字区域包括:确定第一边缘点和位于相邻边缘线上的第二边缘点;根据第一边缘点和第二边缘点之间的距离确定行高;连接行高的差值在预定距离差范围内的相邻的第一边缘点,确定第一边缘线,连接行高的差值在预定距离差范围内的相邻的第二边缘点,确定第二边缘线,第一边缘线与第二边缘线之间的区域为文字区域。
可选地,确定第一边缘点和位于相邻边缘线上的第二边缘点包括:在边缘图像中取一点作为第一边缘点;从第一边缘点沿像素梯度的方向发射射线,直至下一边缘点;若第一边缘点与下一边缘点法向量的夹角小于预定角度阈值,则确定下一边缘点为第二边缘点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710152728.X/2.html,转载请声明来源钻瓜专利网。





