[发明专利]训练分类器、图像中文字区域检测的方法及系统有效
| 申请号: | 201210303844.4 | 申请日: | 2012-08-23 |
| 公开(公告)号: | CN103632159A | 公开(公告)日: | 2014-03-12 |
| 发明(设计)人: | 邓宇;陈艳琴 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/54 |
| 代理公司: | 隆天国际知识产权代理有限公司 72003 | 代理人: | 张艳杰;张浴月 |
| 地址: | 开曼群岛大开曼*** | 国省代码: | 开曼群岛;KY |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 训练 分类 图像 文字 区域 检测 方法 系统 | ||
1.一种训练用于图像中文字区域检测的分类器的方法,其特征在于,包括:
获取图像样本,所述样本大小为n列*m行像素,n,m为正整数;
对所述样本进行灰度处理,得到经灰度处理的样本;
从所述经灰度处理的样本提取图像特征,所述图像特征包括梯度信息、颜色信息和连通域信息;
利用提取的图像特征训练用于图像中文字区域检测的分类器。
2.根据权利要求1所述的方法,其特征在于,从所述经灰度处理的样本提取梯度信息的步骤包括:
对所述经灰度处理的样本进行j个方向的梯度信息计算,得到所述经灰度处理的样本中每行中所有像素的梯度的和值,从而得到m个和值,其中,j为大于或等于3的正整数;
利用m个和值中的一和值对应的行的行号将所述经灰度处理的样本划分为k个子区域,k为大于或等于3的正整数;
将m个和值中的该和值对应的行的标记作为1维特征;
分别从每一方向计算每一子区域的所有像素的梯度的均值和方差,得到2*j*k维特征。
3.根据权利要求1所述的方法,其特征在于,从所述经灰度处理的样本提取颜色信息的步骤包括:
将所述经灰度处理的样本的灰度空间划分为L个bin,每个bin的高度为落入该bin的像素个数,从而得到所述经灰度处理的样本的颜色分布的直方图;
计算所述直方图的方差和信息熵,作为所述经灰度处理的样本的2维特征;
其中,所述直方图的方差为信息熵为其中,Zi为第i个bin的的灰度,μ为Zi的和值的均值,L为直方图灰度的划分个数,p(Zi)为落入所述直方图的像素的个数占所述经灰度处理的样本的总像素数量的比例,其中,i,L为大于1的正整数。
4.根据权利要求1所述的方法,其特征在于,从所述经灰度处理的样本提取连通域信息的步骤包括:
采用聚类算法对所述经灰度处理的样本进行聚类运算,将经灰度处理的样本中的像素聚为两类,将同一类像素设为白色或黑色;
统计所述经灰度处理的样本的4个边沿部分的所有像素的灰度,如果4个边沿部分中超过预设数量的像素的灰度为白色,则对所述经灰度处理的样本进行反色处理,从而得到文字为白色、背景为黑色的黑白二值图;
从所述黑白二值图中提取白色连通域,计算所述白色连通域中心的X坐标和Y坐标的均值,得到2维特征,将所述白色连通域的大小的标准差作为另一维特征。
5.一种图像中文字区域检测的方法,其特征在于,包括:
获取经灰度处理的待检测图像;
获取与所述经灰度处理的待检测图像对应的黑白二值图;
根据所述黑白二值图确定所述经灰度处理的待检测图像中的候选检测区域;
根据从所述候选检测区域提取的图像特征和用于图像中文字区域检测的分类器确定所述经灰度处理的待检测图像中的候选文字区域,所述图像特征包括梯度信息、颜色信息和连通域信息;
根据所述候选文字区域获取图像中的文字区域。
6.根据权利要求5所述的方法,其特征在于,在获取与所述经灰度处理的待检测图像对应的黑白二值图的步骤之后,根据所述黑白二值图确定所述经灰度处理的待检测图像中的候选检测区域的步骤之前,还包括:
对所述经灰度处理的待检测图像和所述黑白二值图进行多尺度变换,得到多幅不同尺度的经灰度处理的待检测图像和所述黑白二值图。
7.根据权利要求5所述的方法,其特征在于,根据所述黑白二值图确定所述经灰度处理的待检测图像中的候选检测区域的步骤包括:
利用预设大小的滑动框遍历所述经灰度处理的待检测图像,判断与所述经灰度处理的待检测图像对应的所述黑白二值图中对应该滑动框的区域中的预设位置的像素是否为白色,如果是,则确定所述经灰度处理的待检测图像中对应该滑动框的区域为候选检测区域。
8.根据权利要求7所述的方法,其特征在于,还包括:如果判断与所述经灰度处理的待检测图像对应的所述黑白二值图中对应该滑动框的区域中的预设位置的像素为黑色,则以预设的步长在所述经灰度处理的待检测图像上继续滑动该滑动框。
9.根据权利要求7或8所述的方法,其特征在于,所述预设位置为所述黑白二值图中对应该滑动框的区域中的左上角、左下角、右上角、右下角或中心位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210303844.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种建筑机电智能化控制系统
- 下一篇:一种用于车窗固定的新型铝合金型材
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





