[发明专利]一种基于深度学习的台标检测方法在审
申请号: | 201710081113.2 | 申请日: | 2017-02-15 |
公开(公告)号: | CN106845442A | 公开(公告)日: | 2017-06-13 |
发明(设计)人: | 杭欣;郭伟伟 | 申请(专利权)人: | 杭州当虹科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20;G06K9/34;G06K9/42;G06K9/62;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 310012 浙江省杭州市西*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 台标 检测 方法 | ||
技术领域
本发明涉及一种基于深度学习的台标检测方法,尤其涉及一种数字视频信号处理和图像识别领域的方法。
背景技术
随着大量视频信息涌入人们的现实生活,视频台标检测作为对视频来源分析的一个有效手段。通过视频的台标,可以相对容易的确定视频的发布者,通过节目中的标识又能定位到具体的节目。通过这些重要语义信息,可以提供精确的视频搜索。此外,通过检测视频节目中的台标可以去除广告片段(国外很多电视节目广告片段中不含有台标),提高观赏性。同时,在视频安全领域,视频台标检测技术可以有效的确定视频来源,为过滤固定电视台的节目提供了自动监测手段。
现有的台标检测方法有提取台标的全局特征(颜色特征、纹理特征和梯度特征)和局部特征(SURF特征),并通过SVM模型将这些特征融合,训练得到一个完整的台标检测模型。但是这种传统的算法处理速度慢、步骤繁多且检测准确度不高。
发明内容
针对传统台标检测模型算法存在的不足,本发明一种基于深度学习的台标检测方法,提出一种通过对包含台标标志的图片进行缩放、裁剪、平移、加黑边等处理后,采用卷积、池化、全连接等技术手段对这些图片进行反复离线台标检测训练,并采用GPU来完成这一训练过程,在训练中不断调整参数使得训练收敛,从而获取最优参数配置并使用该参数集初始化台标检测系统进行视频图像的在线台标检测的基于深度学习的台标检测方法。在训练时对图像人为进行多种变换处理可有效提高检测结果的鲁棒性,同时采用深度卷积和池化处理手段有效提高检测的范化能力,加之采用GPU完成离线训练过程大大提高训练速度和效率,使得该方法相对传统检测方法更具高效、高速、简单和高精度的优势。
本发明解决其技术问题所采用的技术方案包括以下步骤:
训练图片输入步骤,向离线训练系统输入训练所需类型的图片。
优选的,所述所需类型的图片是指包含台标标志的图片。
图片变换处理步骤,对输入的图片按照特定方式进行变换处理生成新的图片。
优选的,所述特定方式包括对图片进行缩放、平移、加黑边和裁剪等,其目的是增强对台标图片识别能力的鲁棒性。
图片标注步骤,对图片的特定信息进行标注。
优选的,所述特定信息包括:台标的中心点坐标及台标的宽、高等及类别信息。
离线训练步骤,向离线训练系统输入特定图片进行检测训练直到训练收敛。
优选的,所述离线训练系统包括:图像缩放单元、单卷积及池化单元、多卷积及池化单元、多卷积单元和全连接层单元,所述训练使用GPU处理完成。
优选的,所述图像缩放单元负责将输入图像的大小缩放为448*448大小。
优选的,所述单卷积采用的卷积核包括:7*7、3*3和1*1三种,所述多卷积单元为多个卷积层形成的卷积单元,本离线训练系统使用了24个级联卷积层,单卷积和多卷积处理均为局部连接。
优选的,所述池化处理的作用是增强鲁棒性并减少参数输入、防止过拟合现象发生,其输入为上一次卷积产生的结果,且不需要参数输入。
优选的,所述全连接层共两个,为全网络连接,负责将本层每个节点和上层的所有节点建立连接以提高特征的范化能力,且第二个全连接层维度较第一个低,作用是降维。
优选的,所述离线训练步骤中,输入训练图片进行循环检测训练,结束条件为:在当前参数配置下,训练收敛,冻结此时使用的参数集,用于初始化在线台标检测模型。
在线检测步骤,利用离线训练系统生成的参数集初始化在线检测系统,并采用该系统对视频台标进行在线检测。
采用上述技术方案,本发明具有以下优点:
本发明涉及一种基于深度学习的台标检测方法,通过对包含台标标志的图片进行缩放、裁剪、平移、加黑边等处理后,采用卷积、池化、全连接等技术手段对这些图片进行反复离线台标检测训练,并使用GPU来完成这一训练过程,在训练中不断调整参数使得训练收敛,从而获取最优参数配置并使用该参数集初始化台标检测系统进行视频图像的在线台标检测。在训练时对图像人为进行多种变换处理可有效提高检测结果的鲁棒性,同时采用深度卷积和池化处理手段有效提高检测的范化能力,采用GPU完成离线训练过程大大提高训练速度和效率,使得该方法相对传统检测方法更具高效、高速、简单和高精度的优势。
附图说明
图1为本发明较佳实施方式的一种基于深度学习的台标检测方法的步骤示意图。
图2为本发明较佳实施方式的一种基于深度学习的台标检测方法的详细流程图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州当虹科技有限公司,未经杭州当虹科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710081113.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于图像识别航空蓄电池电量充满预测方法
- 下一篇:一种易装拆式LED灯具