[发明专利]区域识别方法及装置有效
| 申请号: | 201510726153.9 | 申请日: | 2015-10-30 |
| 公开(公告)号: | CN105528606B | 公开(公告)日: | 2019-08-06 |
| 发明(设计)人: | 龙飞;张涛;陈志军 | 申请(专利权)人: | 小米科技有限责任公司 |
| 主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/46 |
| 代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 张所明 |
| 地址: | 100085 北京市海淀区清*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 区域 识别 方法 装置 | ||
本公开揭示了一种区域识别方法及装置,属于图像处理领域。所述区域识别方法包括:对文字区域进行二值化,得到二值化后的文字区域;该文字区域包括属于同一行的若干个文字;对二值化后的文字区域按照竖直方向计算直方图,该直方图包括:每列像素点的横坐标和每列像素点中前景色像素点的累加值;根据直方图中的累加值的分布信息,识别文字区域中的文字的字符区域。通过对二值化后的文字区域按照竖直方向计算直方图,根据直方图中的分布信息,识别文字区域中的文字的字符区域;解决了相关技术中文字区域定位准确度较低问题;达到了可以根据直方图中的前景色像素点的累加值的分布信息来精确定位文字的字符区域的效果。
技术领域
本公开涉及图像处理领域,特别涉及一种区域识别方法及装置。
背景技术
在图像处理领域,终端识别图像中的文字之前,终端需要先识别文字的字符区域。
相关技术中提供的一种区域识别方法包括:终端去除图像中的背景,提取得到前景图像;然后通过边缘增强技术识别提取得到的前景图像中的文字的边缘;根据识别得到的各个文字的边缘确定各个文字的字符区域。
在上述方案中,由于边缘增强技术只能提供粗略定位,所以上述方案定位得到的字符区域的准确度较低。
发明内容
为了解决相关技术中字符区域定位准确度低的问题,本公开提供一种区域识别方法及装置。所述技术方案如下:
根据本公开实施例的第一方面,提供一种区域识别方法,该方法包括:
对文字区域进行二值化,得到二值化后的文字区域,该文字区域包括属于同一行的若干个文字;
对二值化后的文字区域按照竖直方向计算直方图,该直方图包括:每列像素点的横坐标和每列像素点中前景色像素点的累加值;
根据直方图中的累加值的分布信息,识别文字区域中的文字的字符区域。
可选的,根据直方图中的累加值的分布信息,识别文字区域中的文字的字符区域,包括:
根据直方图中的累加值的分布信息确定若干组横坐标,每组横坐标包括第一横坐标以及位于第一横坐标右侧的首个第二横坐标;该第一横坐标以及第一横坐标右侧的相邻横坐标对应的累加值大于第一阈值,且第一横坐标左侧的相 邻横坐标对应的累加值小于第二阈值;第二横坐标以及第二横坐标左侧的相邻横坐标对应的累加值大于第一阈值,且第二横坐标右侧的相邻横坐标对应的累加值小于第二阈值;
对于每组横坐标,将第一横坐标所在的像素列识别为一个字符区域的左边缘,将第二横坐标所在的像素列识别为字符区域的右边缘。
可选的,根据直方图中的累加值的分布信息确定若干组横坐标,包括:
根据累加值的分布信息,识别直方图中的第三横坐标,该第三横坐标为:若干个文字中的第一个有效文字的字符区域的左边缘在直方图中所对应的横坐标,或者,若干个文字中的最后一个有效文字的字符区域的右边缘在直方图中所对应的横坐标;
以第三横坐标为搜索起点,按照预定方向基于累加值的分布信息搜索出若干组横坐标。
可选的,第三横坐标为若干个文字中的第一个有效文字的字符区域的左边缘在直方图中所对应的横坐标,以第三横坐标为搜索起点,按照预定方向基于累加值的分布信息搜索出若干组横坐标,包括:
对于第i组横坐标,以直方图中的第i组横坐标中的第一横坐标为搜索起点,向右搜索首个第四横坐标,第四横坐标以及第四横坐标左侧的相邻横坐标对应的累加值大于第一阈值,第四横坐标右侧的相邻横坐标对应的累加值小于第二阈值;1≤i≤n,i为初始值为1的正整数,n为若干个文字中的有效文字的个数;第1组坐标中的第一横坐标为第三横坐标;
将第四横坐标确定为第i组坐标中的第二横坐标;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于小米科技有限责任公司,未经小米科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510726153.9/2.html,转载请声明来源钻瓜专利网。





