[发明专利]基于深度学习的电视台标识别系统在审
申请号: | 201611151654.X | 申请日: | 2016-12-14 |
公开(公告)号: | CN106599892A | 公开(公告)日: | 2017-04-26 |
发明(设计)人: | 伍强;刘明华 | 申请(专利权)人: | 四川长虹电器股份有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34;G06K9/62 |
代理公司: | 成都虹桥专利事务所(普通合伙)51124 | 代理人: | 吴中伟 |
地址: | 621000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 电视 台标 识别 系统 | ||
技术领域
本发明涉及计算机视觉技术,特别涉及基于深度学习的电视台标识别系统。
背景技术
随着广播媒体的蓬勃发展,广播电视已渗透到日常生活和工作的各个方面。考虑到电视台台标在区分电视台方面的重要作用,实现计算机自动识别电视台台标具有重大的意义。一、电视台台标是许多电视台与其他电视台区分的鲜明标志,可用于保护其商业利益,也是电视信号是否出现非法插播、停播或黑屏的重要体现;二、电视台台标识别可用于有线付费频道的快速检索;三、有助于图像处理工具对于台标的移除,从而提高视频的质量。四、电视运营商或者商家可以根据电视台标识别的结果向用户针对性地推荐相关信息,例如电视节目中正在出现的商品或者服务等;五、电视台台标识别可以检测通过卫星传送信号的有线电视的信号稳定性,保证广播电视节目不被非法信号干扰,特别国外的非法组织攻击转播卫星,插播非法反动信号等。
现有的台标识别方法大多对以下情况识别率低或者根本就没有考虑以下情况:(1)相似颜色和透明台标不易;(2)极其相似的省级台标,台标几何形状一样且只有阿拉伯数字不一样的台标,比如四川2-7台;(3)转播的台标发生重叠,比如四川卫视转播CCTV1。因此,我们需要设计一种高效率的、高准确率的方法及系统对电视台标进行识别。
发明内容
本发明要解决的技术问题是:提供一种基于深度学习的电视台标识别系统,提高台标的识别能力。
为解决上述问题,本发明采用的技术方案是:基于深度学习的电视台标识别系统,包括:
样本采集模块,用于采集台标样本;
样本筛选模块,用于筛选样本,剔除不合适的样本;
台标分割模块,用于分割台标和背景;
样本合成模块,用于人工合成差异性的样本;
模型训练模块,基于采集的样本和人工合成的样本,训练台标的识别模型;
台标识别模块,基于识别模型识别台标。
进一步的,采集模块进行样本采集时,具备一定的时间间隔。
进一步的,不合适的样本为:由于网络卡顿采集到的相同画面和台标严重形变的台样本以及由于换台造成的无台标的样本。
进一步的,分割台标和背景的步骤包括:
首先选择一张黑色背景的台标图像,按照宽为原图的三分之一和高位原图的五分之一截取左上角的子图像,将获取的子图像采用二值滤波,消除噪声,获得台标前景图像,最后在水平方向和垂直方向分别投影,分割出台标本身。
进一步的,人工合成样本的方法包括
固定台标位置合成方法:首先截取一张固定大小没有台标的背景图像;其次选择台标前景图像;最后将两种图像叠加在一起即可;
任意台标位置合成方法:首先截取一张固定大小没有台标的背景图像;其次选择台标本身图像,并确定台标的尺寸;最后在背景图像上面随机选择一个和台标尺寸一样的区域,并将这个区域和台标叠加在一起即可。
进一步的,叠加的方式为:首先记录台标前景图像中像素不为0的位置;其次将背景图像中这些位置的像素值设置为台标前景图像这些位置的像素值。
进一步的,对人工合成的样本采用高斯平滑处理边缘信息。
进一步的,台标识别模块采用CNN算法作为台标识别算法;其中,CNN模型结构包括四层卷积层和两层全链接,且卷积层之后都有激活函数和max-pooling层。
进一步的,激活函数为Max-Feature-Map,格式如下:
其中,C∈Rh×w×2n,C的数量是2n,2n代表代表特征图谱的数量;k的取值范围为1-n;R代表的实数集合;h代表卷积特征图谱的高度;w代表卷积特征图谱的宽度;i代表卷积特征图谱中的y轴方向的位置,取值范围为1-h;j代表卷积特征图谱中的x轴方向的位置,取值范围为1-w。
进一步的,四层卷积层的卷积核和stride(即每次卷积的间隔像素个数)分别为:9X9X96/1、5X5X192/1、5X5X256/1、4X4X384/1;所有的max-pooling核和stride都为2x2/2;第一个全连层的神经元的个数为256;第二个全连接层的神经元的个数根据台标数量而定。
本发明的有益效果是:本发明可高实时性且高准确率解决台标识别的问题,包括正常台标(如四川卫视)、转播台标(如四川卫视转播CCTV1)、极其相似台标(如四川2-7台);同时优化深度学习的模型解决深度学习算法在终端运行效率低的问题、占用CPU资源高的问题。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川长虹电器股份有限公司,未经四川长虹电器股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611151654.X/2.html,转载请声明来源钻瓜专利网。