[发明专利]一种实时的视频目标检测方法在审
申请号: | 201811346329.8 | 申请日: | 2018-11-13 |
公开(公告)号: | CN109508672A | 公开(公告)日: | 2019-03-22 |
发明(设计)人: | 柏正尧;蒋冬 | 申请(专利权)人: | 云南大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04 |
代理公司: | 昆明大百科专利事务所 53106 | 代理人: | 何健 |
地址: | 650500 云南省昆*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 上采样 检测 视频目标 数据集 卷积 卷积神经网络 公共数据库 定位结果 分割结果 分类提供 目标分类 目标检测 实时视频 图像识别 重复利用 分类 预测 低层 跨层 粗糙 数据库 标准化 替代 网络 | ||
1.一种实时的视频目标检测方法,其特征在于:
1)数据集来源于PASCALVOC公共数据库,该数据库为图像识别和分类提供了一整套标准化的数据集;
2)用层数更多的卷积神经网络替代层数少的网络,通过对特征的重复利用,使训练的模型对物体的分类以及位置的预测更为精确;
3)通过卷积层的跨层连接,再通过上采样操作增加预测层得到目标的分类及位置;
4)单纯进行上采样得到的分割结果比较粗糙,连接上采样层和低层卷积层的特征得到了更为精确的目标分类和定位结果。
2.根据权利要求1所述的一种实时的视频目标检测方法,其特征在于,将实时的视频目标检测视为一个模式的转化问题,即目标的分类为第一模式,目标的定位为第二模式;采用一个改进的卷积神经网络模拟第一模式和第二模式之间的映射关系。
3.根据权利要求1所述的一种实时的视频目标检测方法,其特征在于,用层数更多的卷积神经网络替代层数少的网络是:采用一个改进的卷积神经网络模拟第一模式和第二模式之间的映射关系;用损失函数表示当前神经网络分类及定位结果图与标准图之间的误差;在训练过程中反复迭代误差损失函数,当损失函数尽可能小时,训练得到模型已能够有效提取对视频目标的分类与定位的映射规律,通过所学到的规律准确检测视频中的目标;整个目标检测过程包括目标分类和目标定位两部分组成。
4.根据权利要求1或2或3所述的一种实时的视频目标检测方法,其特征在于,基于密集连接的所述卷积神经网络架构设计了一个能够有效提取图像特征的神经网络;该网络包含特征的提取和特征连接两部分;该网络的思想是连接低层的卷积层,提高对特征的重复利用,并在第一层预测层之后增加上采样操作,连接低层特征,提高对特征的利用,在大尺度上进行目标的分类及定位使目标的检测更为精确。
5.根据权利要求1或2或3所述的一种实时的视频目标检测方法,其特征在于,采用的所述卷积神经网络是一种块密集连接架构,每一层卷积层都接收来自前面所有卷积层的输出,每一块中都有两层卷积层,其卷积核大小分别为1x1、3x3,且每个卷积层后都有一个激活函数leaky-ReLU;在连续几个块之后是一个大小为3x3,步长为2的卷积层,作用是降低图像分辨率,得到图像的深度特征;特征复用就是进行通道合并操作,使低层特征一直被使用,提高特征利用率,在上采样后将对于大小相同的低层特征进行通道合并,提升第二次预测的结果;神经网络的输入使需检测的图像,输出则是对图像中目标的分类及定位。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云南大学,未经云南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811346329.8/1.html,转载请声明来源钻瓜专利网。