[发明专利]训练分类器、图像中文字区域检测的方法及系统有效
申请号: | 201210303844.4 | 申请日: | 2012-08-23 |
公开(公告)号: | CN103632159A | 公开(公告)日: | 2014-03-12 |
发明(设计)人: | 邓宇;陈艳琴 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/54 |
代理公司: | 隆天国际知识产权代理有限公司 72003 | 代理人: | 张艳杰;张浴月 |
地址: | 开曼群岛大开曼*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 训练 分类 图像 文字 区域 检测 方法 系统 | ||
技术领域
本申请涉及图像检测领域,尤其涉及一种训练分类器的方法及系统、图像中文字区域检测的方法及系统。
背景技术
图像中文字区域的检测历来是图像检测的一个重要课题,以图像中的商标为例,商标是指生产者、经营者为使自已的商品或服务与他人的商品或服务相区别,而使用在商品或服务上的一种可视性标志。大多数商标包括文字部分,这样的商标也可以称为文字商标。对于许多网站,尤其是电子商务网站,存在各种侵犯商标专用权的行为,比如卖家发布的图像中使用了某个未经商标持有人授权的商标,这种行为对商标持有人和商品购买者都带来了很多的利益损害。如果可以在一幅图像中检测出商标的文字区域,则可以为后续的商标侵权判断提供更精准的依据。目前常用的图像中文字区域的检测方法如下:
第一、基于边缘检测的方法。该方法是利用文字区域存在较多边缘的特点,先检测待检测图像的边缘,然后利用形态学等方法定位待检测图像中的文字区域。虽然基于边缘检测的方法可以快速检测待检测图像中的文字区域,但由于文字经常直接叠加在复杂的背景中,文字区域周围的背景的边缘经常会与文字的边缘粘连在一起,从而影响待检测图像中的文字区域定位的准确性。
第二、基于区域分析的方法。该方法是利用颜色信息从待检测图像中提取连通域,再根据区域几何约束使用阈值规则从连通域中定位文字区域。但该方法的缺陷在于:在待检测图像背景复杂时很难准确地提取连通域,并且在该方法中使用的几何规则和阈值更缺乏鲁棒性,很难推广。
第三、基于机器学习的方法。该方法事先通过选取样本来对分类器进行训练,使之能在不断变化的因素中定位待检测图像的文字区域和背景区域两种模式。但该方法的难点和关键在于训练特征提取,即如何快速有效地从预处理阶段输出的信息中,提取出能代表待检测图像的文字区域的特征的有效信息,因此,训练样本的选择对于检测效果有较大影响,并且该方法处理速度慢。
发明内容
为了快速且准确地检测图像中文字区域,本申请提供了一种训练分类器的方法及系统、图像中文字区域检测的方法及系统。
本申请的一个方案提供了一种训练用于图像中文字区域检测的分类器的方法,包括:
获取图像样本,所述样本大小为n列*m行像素,n,m为正整数;
对所述样本进行灰度处理,得到经灰度处理的样本;
从所述经灰度处理的样本提取图像特征,所述图像特征包括梯度信息、颜色信息和连通域信息;
利用提取的图像特征训练用于图像中文字区域检测的分类器。
本申请的另一个方案提供了一种图像中文字区域检测的方法,包括:
获取经灰度处理的待检测图像;
获取与所述经灰度处理的待检测图像对应的黑白二值图;
根据所述黑白二值图确定所述经灰度处理的待检测图像中的候选检测区域;
根据从所述候选检测区域提取的图像特征和用于图像中文字区域检测的分类器确定所述经灰度处理的待检测图像中的候选文字区域,所述图像特征包括梯度信息、颜色信息和连通域信息;
根据所述候选文字区域获取图像中的文字区域。
本申请的再一个方案提供了一种训练用于图像中文字区域检测的分类器的系统,包括:
样本获取模块,用于获取图像样本,所述样本大小为n列*m行像素,n,m为正整数;
灰度处理模块,用于对所述样本进行灰度处理,得到经灰度处理的样本;
图像特征提取模块,用于从所述经灰度处理的样本提取图像特征,所述图像特征包括梯度信息、颜色信息和连通域信息;
分类器训练模块,用于利用提取的图像特征训练用于图像中文字区域检测的分类器。
本申请的再一个方案提供了一种图像中文字区域的检测系统,包括:
待检测图像获取模块,用于获取经灰度处理的待检测图像;
黑白二值图获取模块,用于获取与所述经灰度处理的待检测图像对应的黑白二值图;
候选检测区域确定模块,用于根据所述黑白二值图确定所述经灰度处理的待检测图像中的候选检测区域;
候选文字区域确定模块,用于根据利用从所述候选检测区域提取的图像特征和用于图像中文字区域检测的分类器确定所述经灰度处理的待检测图像中的候选文字区域,所述图像特征包括梯度信息、颜色信息和连通域信息;
文字区域获取模块,用于根据所述候选文字区域获取图像中的文字区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210303844.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种建筑机电智能化控制系统
- 下一篇:一种用于车窗固定的新型铝合金型材
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序