[发明专利]一种基于深度学习的台标检测方法在审
申请号: | 201710081113.2 | 申请日: | 2017-02-15 |
公开(公告)号: | CN106845442A | 公开(公告)日: | 2017-06-13 |
发明(设计)人: | 杭欣;郭伟伟 | 申请(专利权)人: | 杭州当虹科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20;G06K9/34;G06K9/42;G06K9/62;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 310012 浙江省杭州市西*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 台标 检测 方法 | ||
1.一种基于深度学习的台标检测方法,其特征在于,该方法包含以
下步骤:
训练图片输入步骤,向离线训练系统输入训练所需类型的图片;
图片变换处理步骤,对输入的图片按照特定方式进行变换处理生成新的图片;
图片标注步骤,对图片中台标的特定信息进行标注;
离线训练步骤,向离线训练系统输入特定图片进行检测训练直到训练收敛为止;
在线检测步骤,利用离线训练系统生成的参数集初始化在线检测系统,并采用该系统对视频台标进行在线检测。
2.如权利要求1所述的一种基于深度学习的台标检测方法,其特征
在于,所述训练图片输入步骤中,所述所需类型的图片是指包含台标标志的图片。
3.如权利要求1所述的一种基于深度学习的台标检测方法,其特征
在于,所述图片变换处理步骤中,所述特定方式包括对图片进行缩放、平移、加黑边和裁剪等,其目的是增强对台标图片识别能力的鲁棒性。
4.如权利要求1所述的一种基于深度学习的台标检测方法,其特征
在于,所述图片标注步骤中,所述特定信息包括:台标的中心点坐标及台标的宽、高等及类别信息。
5.如权利要求1所述的一种基于深度学习的台标检测方法,其特征
在于,所述离线训练步骤中,所述离线训练系统包括:图像缩放单元、单卷积及池化单元、多卷积及池化单元、多卷积单元和全连接层单元,所述训练使用GPU处理完成。
6.如权利要求5所述的一种基于深度学习的台标检测方法,其特征
在于,所述图像缩放单元负责将输入图像的大小缩放为448*448大小。
7.如权利要求5所述的一种基于深度学习的台标检测方法,其特征
在于,所述单卷积采用的卷积核包括:7*7、3*3和1*1三种,所述多卷积单元为多个卷积层形成的卷积单元,本离线训练系统使用了24个级联卷积层,单卷积和多卷积处理均为局部连接。
8.如权利要求5所述的一种基于深度学习的台标检测方法,其特征
在于,所述池化处理的作用是增强鲁棒性并减少参数输入、防止过拟合现象发生,其输入为上一次卷积产生的结果,且不需要参数输入。
9.如权利要求5所述的一种基于深度学习的台标检测方法,其特征
在于,所述全连接层共两个,为全网络连接,负责将本层每个节点和上层的所有节点建立连接以提高特征的范化能力,且第二个全连接层维度较第一个低,作用是降维。
10.如权利要求1所述的一种基于深度学习的台标检测方法,其特征
在于,所述离线训练步骤中,输入训练图片进行循环检测训练,结束条件为:在当前参数配置下,训练收敛,冻结此时使用的参数集,用于初始化在线台标检测模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州当虹科技有限公司,未经杭州当虹科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710081113.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于图像识别航空蓄电池电量充满预测方法
- 下一篇:一种易装拆式LED灯具