[发明专利]基于Gabor滤波器的文字信息特征提取与识别方法在审
申请号: | 201710027704.1 | 申请日: | 2017-01-16 |
公开(公告)号: | CN106778732A | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 刘明珠;李文静;郑云非 | 申请(专利权)人: | 哈尔滨理工大学 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/32;G06K9/46 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 gabor 滤波器 文字 信息 特征 提取 识别 方法 | ||
技术领域:
本发明涉及一种基于Gabor滤波器的文字信息特征提取与识别方法。
背景技术:
近年来,随着人们的生活水平的提升以及多媒体信息技术的不断发展,图像、视频已经成为人们的日常生活中不可缺少的一种重要的信息媒介,也成为互联网中信息传播的一种途径。在现实生活中,新闻、电影与电视剧以及自拍视频等多媒体内容每天都会大量的产生。面对互联网上如此大容量的视频和图像,如何对视频数据的管理、使用以及对重要视频内容的检索就变得异常的重要。
视频的文字是具有高层语义信息的,一般情况下,是对视频内容的辅助和说明,便于人们理解视频内容以及对视频的检索等,所以文字信息是与视频密不可分的。如果能够对视频中的文字进行有效的识别,就可以利用识别到的文字信息实现对视频内容进行自动摘要,让人们在对视频进行检索、视频的理解以及分析等方面更加方便。所以,如何对视频中的文本内容进行有效的定位以及识别就变得非常有意义。针对视频和图像中文本信息的提取,可以将其应用于视频内容检索、智能交通、视觉识别系统、数字图书馆以及一些其它领域。
发明内容:
本发明的目的是为了解决现有的视频和图像中文本信息的提取技术效率较低的问题,而提出的一种基于Gabor滤波器的文字信息特征提取与识别方法。
上述的目的通过以下的技术方案实现:
步骤一、设计Gabor滤波器;
步骤二、设计并训练DBN分类网络;
步骤三、运用形态学的方法,对定位后的图像进行去噪、空洞区域的填充以及孤立点的剔除操作,使定位的文本图像更加精确,并将最终去噪后的文本定位二值图像映射到原始视频帧图像上,得到准确的文本定位区域;
步骤四、对定位并且处理后的准确的文本定位区域,进行文本增强、二值化处理、归一化与特征提取操作;
步骤五、运用OCR识别技术对经步骤四处理后的文本进行识别。
有益效果:
本发明通过Gabor滤波器的特性以及对于文字纹理特征响应的特点。研究正弦平面波的特性和高斯函数的属性,给出了利用Gabor滤波器对文字信息特征的提取方法,以及在四个方向上对于文字的纹理特征的响应情况。利用深度学习的方法,构造深度置信网络。通过构造的网络对Gabor滤波器在四个方向上输出的纹理特征图像进行处理,实现对文本的定位。然后利用形态学的处理方法,对视频中定位到的文本区域进行腐蚀与膨胀、开闭混合运算等以去除噪声、孤立点、以及对空洞区域的填充等,使定位到的文本图像更加准确。最后,对形态学处理后的文本区域,进行图像二值化、字符切分与归一化以及特征提取等,使得处理后的文本能够有效的在OCR中识别,从而提升视频中文本的识别率。
具体实施方式:
具体实施方式一:
本实施方式的基于Gabor滤波器的文字信息特征提取与识别方法,所述的文字信息特征提取与识别方法通过以下步骤实现:
步骤一、设计Gabor滤波器;
步骤二、设计并训练DBN分类网络;
步骤三、运用形态学的方法,对定位后的图像进行去噪、空洞区域的填充以及孤立点的剔除操作,使定位的文本图像更加精确,并将最终去噪后的文本定位二值图像映射到原始视频帧图像上,得到准确的文本定位区域;
步骤四、对定位并且处理后的准确的文本定位区域,进行文本增强、二值化处理、归一化与特征提取操作;
步骤五、运用OCR识别技术对经步骤四处理后的文本进行识别。
具体实施方式二:
与具体实施方式一不同的是,本实施方式的基于Gabor滤波器的文字信息特征提取与识别方法,步骤一所述的设计Gabor滤波器的过程是指选择合适参数对视频帧图像从0°、45°、90 °、135 °四个方向上对字符特殊的纹理特征进行处理,得到四幅在这四个方向上的纹理特征图像,抑制背景区域,保持四个方向上的文字纹理特征,具体为:
将Gabor滤波器在空间域看做是一个正弦平面波,这个正弦平面波整好被Gaussian函数调制从而形成Gabor滤波器,其中,Gabor滤波器由7个参数来决定,分别是中心点、角度、均方差和以及和,并通过以下假设简化Gabor滤波器的函数,
(1).正弦平面波的方向与Gaussian核函数的旋转角度相同,即;
(2).Gaussian核函数的中心点在(0,0),均方差;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨理工大学,未经哈尔滨理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710027704.1/2.html,转载请声明来源钻瓜专利网。