[发明专利]基于深度学习SSD框架的道路车辆实时检测方法有效
申请号: | 201611183427.5 | 申请日: | 2016-12-20 |
公开(公告)号: | CN106611162B | 公开(公告)日: | 2019-06-18 |
发明(设计)人: | 谢雪梅;陈鹏飞;石光明;廖泉;李佳楠;杨文哲;韩笑 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G08G1/017 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 王品华 |
地址: | 710071 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 ssd 框架 道路 车辆 实时 检测 方法 | ||
1.基于深度学习SSD框架的道路车辆实时检测方法,包括如下步骤:
1)构建训练数据集:
1a)在交通要道拍摄行驶车辆的若干个视频,将这些视频每隔10帧保存为图片,并存放到JPEGImages文件夹下作为训练数据;
1b)对1a)的每张图片中车窗部分进行标注,生成txt格式的标注文件并进行xml格式转换,将转换为xml格式的文件均分成两部分,其中将一部分图片的图片名写入到trainval.txt文件中,另一部分则将图片名写入到test.txt文件中,得到训练网络所需的trainval.txt文件、test.txt文件和与图片相对应的xml文件;
1c)将1b)中的所有xml文件进行合并后存放到Annotations文件夹下,并将生成的trainval.txt文件和test.txt文件存放到ImageSet/Main文件夹下;
2)搭建SSD训练网络架构:
2a)下载并安装caffe-ssd平台;
2b)在caffe-ssd平台中下载并打开VGG-16网络结构的deploy.prototxt文件,修改其卷积层及全链接层的层类别,以此作为基础网络base_network;
2c)在基础网络base_network的末尾添加卷积层及池化层,作为额外的特征提取层;
2d)创建用于多尺度输出的mbox_layers层,并根据基础网络base_network,设定mbox_layers层的相关参数;
3)转换数据格式开始训练:
3a)修改caffe_ssd平台下的标签字典,该标签字典的文件名为labelmap_voc.prototxt,即将标签字典改为“汽车”和“背景”这两个类别;
3b)将1)中准备好的数据集存放到data文件夹下,将xml格式的标注文件转换成网络固定输入格式的lmdb格式文件;
3c)将3a)中修改过的标签字典文件和3b)生成的lmdb文件输入到搭建好的SSD训练网络进行训练,得到最终的训练模型;
4)利用训练模型进行视频车辆检测:
4a)将任意待测行驶车辆视频按帧输入到训练好的模型中;
4b)对于输入的每一帧图像,该模型将随机地选取整幅图像的多个区域,并采用卷积算法对每个区域进行打分;
4c)设定一个阈值δ=0.3,将每一个区域的得分分别与δ比较,将得分高于δ的区域,判断为包含汽车车窗,并调用绘图命令对这个区域进行标注;将得分值低于δ的区域,判断为不包含车窗或包含不完全车窗,直到图像上所有被判断为包含汽车车窗的区域均标注完成;
4d)重复4b)-4c),将4a)中待测视频的所有帧图像处理后,得到相应的输出视频,此输出视频将会标注出每一个包含汽车车窗的区域,从而完成对一段视频中每一辆汽车的检测。
2.根据权利要求1所述的方法,其中步骤3c)中训练SSD网络,按如下步骤进行:
3c1)用K个随机取值的卷积核对图像进行卷积得到K个特征图;
3c2)从K个特征图中选取几个特征图,按不同的权重输入到损失函数中计算损失值,并采用梯度下降法更新卷积核的大小和权重的大小;
3c3)重复3c1)-3c2),直到损失函数达到最小,记录卷积核和权重的值。
3.根据权利要求1所述的方法,其中步骤4b)中采用卷积算法对每个区域进行打分,按如下步骤进行:
4b1)用K个训练好的卷积核与一个区域进行二维卷积,得到K个卷积值;
4b2)将K个卷积值求加权平均,即得到该区域的打分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611183427.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种交通标志包围盒的优化方法
- 下一篇:带指纹认证的身份证识别器