[发明专利]一种基于深度卷积神经网络的汽车驾驶场景目标检测方法有效
申请号: | 201710259285.4 | 申请日: | 2017-04-20 |
公开(公告)号: | CN107169421B | 公开(公告)日: | 2020-04-28 |
发明(设计)人: | 林耀荣;陈康 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 罗观祥 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于深度卷积神经网络的汽车驾驶场景目标检测方法,该检测方法包含如下优化技术:首先采用聚类算法对训练数据的目标宽高进行聚类,采用聚类中心优化锚点设置;其次采用分类性能更强的残差网络作为特征提取网络,在此基础上设计一个融合特征网络,利于小目标的检测;其次采用在线困难样本挖掘算法以及均衡正负样本候选区域来优化网络的训练;最后采用训练得到的模型处理图像,并对输出进行后处理优化,实现汽车驾驶场景下的目标检测功能。本发明基于CAFFE深度学习框架以及Faster RCNN算法,通过优化锚点设置、设计融合特征网络、优化训练过程以及对结果后处理,得到了一种高性能的基于深度卷积网络的汽车驾驶场景目标检测方法。 | ||
搜索关键词: | 一种 基于 深度 卷积 神经网络 汽车 驾驶 场景 目标 检测 方法 | ||
【主权项】:
一种基于深度卷积神经网络的汽车驾驶场景目标检测方法,其特征在于,所述检测方法包括下列步骤:S1、通过安装在汽车上的摄像机采集训练图像数据,并对所述训练图像数据进行预处理;S2、利用聚类算法对训练集样本的目标宽高进行聚类,利用聚类中心优化锚点设置;S3、以CAFFE框架为基础,基于分类性能更好的残差网络,采用多层融合特征构建深度卷积神经网络模型;S4、网络初始化,利用在ImageNet上预训练过的模型参数对相应网络层进行初始化,其他新添加的层采用零均值,标准差为σ的高斯分布随机初始化;S5、网络训练,将图像以及真值信息输入上述构造的网络,利用聚类得到的锚点设置,在网络中进行前向计算得到预测值,计算边界框的预测值与真值之间的Smooth L1损失以及目标类别的预测值与真值之间的SoftMax损失,再进行反向传播利用随机梯度下降法更新网络权重;S6、通过汽车上的摄像机采集车辆前方的图像,输入网络进行检测,即可输出目标的类别及坐标,实现目标检测功能。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710259285.4/,转载请声明来源钻瓜专利网。
- 上一篇:一种白扁豆玫瑰茄酱油的制作方法
- 下一篇:一种香菇黑猪肉酱及其加工方法