[发明专利]基于BP神经网络和频谱分析的视频文字区域定位方法有效
申请号: | 201810148366.1 | 申请日: | 2018-02-13 |
公开(公告)号: | CN108241874B | 公开(公告)日: | 2020-12-18 |
发明(设计)人: | 霍华;吕靖;李宁波;常国沁 | 申请(专利权)人: | 河南科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/20;G06N3/04 |
代理公司: | 洛阳公信知识产权事务所(普通合伙) 41120 | 代理人: | 陈佳丽 |
地址: | 471000 河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 基于BP神经网络和频谱分析的视频文字区域定位方法,通过构建BP神经网络对视频帧中的像素点进行分类,对分类到文字类的像素点进行一个基于距离的聚类算法的处理后得到候选文本区域,将候选区域通过快速傅里叶转换到频率域后,再次构建神经网络,基于频谱图对候选区域进行分类,滤除分类为假阳性类的候选区域,从而滤除假阳性。本发明有益效果:定位准确率高,实用性更加全面。 | ||
搜索关键词: | 基于 bp 神经网络 频谱 分析 视频 文字 区域 定位 方法 | ||
【主权项】:
1.基于BP神经网络和频谱分析的视频文字区域定位方法,其特征在于:包括以下步骤:步骤1、提取新闻视频帧,并将所提取的新闻视频帧转化为灰度图像;步骤2、构建BP神经网络作为分类器,将每个图像内的所有像素点进行分类,获得分类为文字类的像素点;步骤3、对步骤2获得的分类为文字类的像素点进行基于距离的聚类处理,获得候选文字区域;步骤4、对步骤3中获得的候选文字区域进行快速傅里叶变换得到频谱图;步骤5、再次构建BP神经网络作为分类器,将候选文字区域分类,滤除假阳性区域。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南科技大学,未经河南科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810148366.1/,转载请声明来源钻瓜专利网。