[发明专利]一种在图像中定位文字的方法和滤波器在审
申请号: | 201610596200.7 | 申请日: | 2016-07-26 |
公开(公告)号: | CN107657254A | 公开(公告)日: | 2018-02-02 |
发明(设计)人: | 朱二龙;罗旻 | 申请(专利权)人: | 北京新岸线网络技术有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100084 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 定位 文字 方法 滤波器 | ||
技术领域
本发明涉及滤波器技术,尤其涉及对图像中的文字进行处理的技术。
背景技术
随着互联网视频内容的不断增加,以及数字图书馆、视频点播、远程教学等大量的多媒体应用,如何在海量视频中检索出所需要的资料显得至关重要。传统的基于关键词描述的视频检索因为描述能力有限、主观性强、手工标注等原因,已经不能满足海量视频检索的需求。因此从20实际90年代开始,基于内容的视频检索技术成为研究的热点问题,而视频字幕的识别技术正是实现视频检索的关键技术。目前提出的视频字幕检测方法,根据所使用的特征,大体可以分为基于区域、基于边缘、基于纹理三种。很多算法实际上综合利用了以上的某两种或全部三种特征。
目前,提出了一种基于笔画的字幕检测方案。基于笔画进行字幕检测的技术方案,需要设计一种笔画滤波器,这种滤波器和传统的边缘纹理滤波器不同,它可以检测到图像中不同尺度的形条结构,对不具有条形结构的边缘和纹理不敏感,这样就会对一些非文字的背景干扰有更好的鲁棒性。
基于笔画检测进行字幕检测的技术方案很有意义,但目前设计的笔画滤波器的应用非常简单,并没有充分考虑到笔画线条亮度一致性、笔画角点和交叉点的影响,降低了笔画检测的效果。
发明内容
有鉴于此,本发明的一个目的是提供一种在图像中定位文字的方法和滤波器。为了对披露的实施例的一些方面有一个基本的理解,下面给出了简单的概括。该概括部分不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念,以此作为后面的详细说明的序言。
本发明公开了一种在图像中定位文字的方法,包括:
接收待检测图像;
计算所述图像的亮笔画图和暗笔画图;
利用所述亮笔画图和暗笔画图,计算文字分布区域;
将每个文字分布区域分割成至少一个文字行;
确定每个文字行的上下边界。
较佳地,所述计算文字分布区域包括:
利用所述亮笔画图和暗笔画图,计算笔画密度图;
对所述亮笔画图做二值化处理;
将二值化处理后的亮笔画图和所述笔画密度图进行或运算;
以新的笔画密度图中的白色像素点连接成的区域作为文字分布区域。
较佳地,所述分割文字行包括:
在每个文字分布区域对像素在亮笔画图上的亮度值进行水平方向上的投影,获得每个文字分布区域的亮度直方图;
在每个文字分布区域将每一行像素在亮笔画图上从零变到非零的次数进行累加,获得每个文字分布区域的交点直方图;
计算亮度直方图上的值小于第一阈值,且在交点直方图上的值小于第二阈值的像素点作为分割点;
在每个文字分布区域沿着查找到的分割点将文字分布区域水平分割开,形成多个文字行。
较佳地,所述确定每个文字行的上下边界包括:
对于每个文字行,从所述亮度直方图的最大值分别向上下两个方向查找该文字行的边界点,沿着边界点水平分割开,形成文字行的上下边界;
其中,边界点满足下述条件:
该点在亮度直方图上的值小于第三阈值,或在交点直方图上的值小于第四阈值。
较佳地,还包括从每一文字行中依次识别并提取独立的文字。
本发明还公开了一种滤波器,用于对图像中的文字笔画进行滤波处理,包括:
输入端口,用于接收待检测图像;
图像处理单元,用于计算所述图像的亮笔画图和暗笔画图;
位置运算单元,用于利用所述亮笔画图和暗笔画图,计算文字分布区域;
分割单元,用于将每个文字分布区域分割成至少一个文字行;
边界确定单元,用于确定每个文字行的上下边界。
较佳地,所述位置运算单元包括:
第一单元,利用所述亮笔画图和暗笔画图,计算笔画密度图;
第二单元,对所述亮笔画图做二值化处理;
第三单元,将二值化处理后的亮笔画图和所述笔画密度图进行或运算;
第四单元,以新的笔画密度图中的白色像素点连接成的区域作为文字分布区域。
较佳地,所述分割单元包括:
第一单元,在每个文字分布区域对像素在亮笔画图上的亮度值进行水平方向上的投影,获得每个文字分布区域的亮度直方图;
第二单元,在每个文字分布区域将每一行像素在亮笔画图上从零变到非零的次数进行累加,获得每个文字分布区域的交点直方图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京新岸线网络技术有限公司,未经北京新岸线网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610596200.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新型自动化粉末渗锌装置
- 下一篇:低温低损伤膜层沉积系统
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序