[发明专利]一种基于改进的DSOD模型的车辆检测与识别方法在审
申请号: | 201910366444.X | 申请日: | 2019-05-05 |
公开(公告)号: | CN110232316A | 公开(公告)日: | 2019-09-13 |
发明(设计)人: | 蒋洋涛;冯涛 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62;G06N3/04 |
代理公司: | 浙江永鼎律师事务所 33233 | 代理人: | 陆永强 |
地址: | 310018*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 车辆检测 子网络 两层 提取图像特征 改进 目标预测 前端检测 特征提取 主干模块 边界框 过渡层 检测 池化 | ||
1.一种基于改进的DSOD模型的车辆检测与识别方法,其特征在于,该方法包括以下步骤:
步骤S1:采用KITTI公开数据集的车辆行驶视频图像,并对训练数据集数据进行预处理;
步骤S2:以TensorFlow框架为基础,使用Python编程语言搭建DSOD网络模型;
步骤S3:网络初始化,直接丢弃使用预训练模型来训练现有的数据集,通过训练数据集的迭代训练更新相关权重值;
步骤S4:网络初始化,直接丢弃使用预训练模型来训练现有的数据集,通过训练数据集的迭代训练更新相关权重值;
步骤S5:通过汽车上的摄像机采集的道路上前方的图像,输入到网络进行检测,即可输出目标检测后的类别及坐标,从而达到目标检测功能;
其中,改进的DSOD网络模型采用proposal-free的检测模型SSD,并加入DenseNet的思想,不需要预训练;
所述DSOD网络模型分成两个部分:用于特征提取的Backbone和用于目标预测的Front-end;Backbone子网络类似于DenseNet,由一层Stem block(主干模块),四层Dense blocks(Dense模块),两层Transition layers(过渡层),两层Transition w/o pooling layers(过渡w/o池化层),作用是用来提取图像特征;Front_end子网络通过Dense Connetion实现边界框检测效果;
所述步骤进一步S3包括:
步骤S31:原始图像读取进来,经过6种不同scale的特征,特征映射来自骨干子网的中间层;
步骤S32:一个具有瓶颈结构的平滑过渡层(1*1卷积层用于减少特征映射的数量加上在两个连续的之间采用3*3转换层特征图的比例;
步骤S33:每个虚线框内都有一个1*1的卷积和一个3*3的卷积操作,相当于一个bottleneck;
步骤S34:每个bottleneck的输入是前面所有bottleneck的输出的级联操作结果,即一半的特征图是从先前的尺度中学习的,而其余的则是半特征映射从连续的高分辨率特征映射中直接下采样;
所述步骤S32进一步包括:
步骤S321:原始图像另一条并行处理的线是downsampling block,其中包括2*2 maxpooling,stride=2和一个1*1,stride=1 conv;
步骤S322:汇集层旨在在连接期间将分辨率与当前大小匹配,1*1转换层用于减少数量渠道达到50%;汇集层位于之前考虑降低计算成本,1*1转换层的下采样块实际上带来了每个使用来自其所有的多分辨率特征映射进行缩放先前的尺度;
所述步骤S4进一步包括:
步骤S41:引入了Focal Loss替代Softmax Loss;
步骤S42:调整loss的计算公式使单级结构在训练初始阶段提高positive的分类概率,根据正负样本计算的损失,然后反向传播迭代训练,直至对道路情况下汽车驾驶场景下的目标检测的准确性和稳定性达到预计要求。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910366444.X/1.html,转载请声明来源钻瓜专利网。