[发明专利]一种基于改进的DSOD模型的车辆检测与识别方法在审
申请号: | 201910366444.X | 申请日: | 2019-05-05 |
公开(公告)号: | CN110232316A | 公开(公告)日: | 2019-09-13 |
发明(设计)人: | 蒋洋涛;冯涛 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62;G06N3/04 |
代理公司: | 浙江永鼎律师事务所 33233 | 代理人: | 陆永强 |
地址: | 310018*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 车辆检测 子网络 两层 提取图像特征 改进 目标预测 前端检测 特征提取 主干模块 边界框 过渡层 检测 池化 | ||
本发明公开了一种基于改进的DSOD模型的车辆检测与识别方法,DSOD是在SSD算法的基础上进行改进的,可以简单理解为SSD+DenseNet=DSOD,采用proposal‑free的检测模型SSD,加入DenseNet的思想。DSOD模型分成两个部分:用于特征提取的Backbone,用于目标预测的Front‑end。Backbone子网络类似于DenseNet,由一层Stem block(主干模块),四层Dense blocks(Dense模块),两层Transition layers(过渡层),两层Transition w/o pooling layers(过渡w/o池化层),作用是用来提取图像特征。Front_end sub_network(前端检测子网络)是通过Dense Connetion实现边界框检测效果。
技术领域
本发明涉及交通图像处理技术领域,尤其涉及一种基于改进的DSOD模型的车辆检测与识别方法。
背景技术
随着国民经济发展和人工智能技术的发展,智能驾驶汽车领域获得了空前的大发展。目标检测是智能驾驶汽车环境识别感知的关键一环,对道路前方目标车辆检测有助于做出安全准确的驾驶决策指令。日常驾驶场景下计算机视觉的目标检测任务中,道路情况相当复杂,各种大小行驶的车辆,车辆相互遮挡情况,晴雨天光照的变化等不利因素都影响着车辆目标检测效果的准确性。在目标检测领域中,传统的人工标注正、负样本方式制作训练样本成本比较高昂,使用HOG(Histogram of Oriented Gradient,方向梯度直方图)或Haar等人工特征进行图像的特征提取,再使用SVM(Support Vector Machine,支持向量机)来判别。但是花费了大量人力、物力制作训练的样本库训练出的分类识别效果不一定满足产品要求。而通过深度学习方法,尤其是深度卷积神经网络(Deep Convolutional NeuralNetworks,DCNN)的出现打破了图像语义表达的局限,通过丰富的特征表达信息进行匹配、评估和分类。比较有代表性的方法:R-CNN(Region-CNN)方法是利用选择性搜索(SelectiveSearch,SS)算法评测相邻图像子块的特征相似度,通过合并打分的候选框输入到卷积神经网络结构内部的分类器进行特征向量分类,达到目标检测定位的目的。Fast R-CNN方法则是设计一种RoI Pooling的池化层结构,解决将图像区域剪裁、缩放到相同尺寸大小的操作,仍然没有摆脱选择性搜索算法生成正负样本候选框的问题。Faster R-CNN方法属于两级检测,使用区域生成网络(Region Proposal Networks,RPN)来提取大量候选区域,对其进行分类和回归,得出目标的位置定位,但由于运算速度过慢,且内存消耗庞大。YOLO(Youonly look once,YOLO)方法属于一级检测,使用7*7的网络进行端对端的回归计算,预测每个网格内的边框坐标和每个类别置信度将目标的分类和定位合并处理,检测速度指标虽较快,但是简单的网络回归运算检测精度并不高。SSD(Single Shot MultiBox Detector,SSD)也是端到端的算法,引入不同卷积层检测结构预测,提升多尺度和多比例的检测能力,但低层特征语义信息的缺失导致小目标检测能力比较弱。
发明内容
为了克服上述背景技术所存在的不足,以及必须要通过在ImageNet分类任务上预训练的模型作为初始权重,本发明提供一种基于改进的DSOD模型的车辆检测与识别方法,本发明提供了一种从0开始训练的检测模型,而不是微调一个预训练的模型,并通过FocalLoss代替Softmax Loss降解目标检测过程中损失,即能准确地实现目标检测,又能提升模型结构的灵活性、学习偏置差异问题和问题域的不匹配。本发明能够对道路情况下汽车驾驶场景下的目标有效检测。
本发明解决其技术问题所采用的技术方案是:
步骤S1:通过KITTI公开数据集的车辆行驶视频图像安数据,并对训练数据集数据进行预处理;
步骤S2:以TensorFlow框架为基础,使用python编程语言搭建DSOD网络模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910366444.X/2.html,转载请声明来源钻瓜专利网。