[发明专利]一种基于YOLOv5改进的车辆检测与识别方法在审

申请号：	202210352291.5	申请日：	2022-04-05
公开（公告）号：	CN114723992A	公开（公告）日：	2022-07-08
发明（设计）人：	张开玉;苏雪梅	申请（专利权）人：	哈尔滨理工大学
主分类号：	G06V10/764	分类号：	G06V10/764;G06V10/80;G06V10/82;G06K9/62;G06N3/04;G06N3/08
代理公司：	暂无信息	代理人：	暂无信息
地址：	150080 黑龙江省***	国省代码：	黑龙江;23
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于 yolov5 改进车辆检测识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于YOLOv5网络改进的车辆检测算法，其特征在于：所述方法主要通过以下步骤实现：

（1）获取车辆检测数据集BDD100k，并对数据集进行预处理；

（1-1）数据集包含10000张图片；由于本发明特定的应用场景，忽略BDD100k数据集中Light、Sign、Person、Bike、Rider这几种类别；将每一张图片对应标签的json格式通过python脚本转换为xml文件；xml文件包含图片名称、图片路径、目标标签名称以及目标位置坐标；

（1-2）将Bus、Truck、Motor、Car、Train统一归为Car类；将统一类别之后的图片及标签xml文件按照VOC格式进行存储；

在VOC文件夹下创建Annotations、JPEGImages两个文件夹用来存储图片和标签；Annotations文件夹中存储每一个标签xml文件，JPEGImages文件夹中存储所有图片；

（1-3）使用python脚本将创建好的VOC格式的数据集随机按照8：2划分为训练集和测试集，同时把数据集标签格式转换成yolo适用的txt格式；

（2）基于DenseNet网络密集连接的思想，将主干网络中的两个CSP1_3模块中的残差网络结构Resunit替换为Dense Block模块；

Dense Block模块包括三层卷积层数，每一层卷积都包括（BN+ReLU+1*1 Conv）+（BN+ReLU+3*3 Conv）；设置Dense Block中的增长率k为32，保证每一层经过3*3卷积之后，都只输出32个Channel，之后与前面层的输入进行拼接，将拼接后的Channel数再作为下一层的输入；

（3）在主干网络SPP模块之后加入Transformer网络；

Transformer网络中，数据首先会经过一个Multi-Head attention的模块，该模块包括8个Self-Attention，得到8个加权之后的特征矩阵；将8个按列拼成一个大的特征矩阵；经Multi-Head attention输出之后经过一个全连接层（Feed Forward Neural Network），这个全连接有两层，第一层的激活函数是ReLU，第二层是一个线性激活函数；最终经Transformer层输出特征图为（512，512，20，20）；最后将主干网络的输出经neck部分进行多尺度特征的融合；

（4）对改进后的网络进行训练和测试。

2.根据权利要求1所述的一种基于YOLOv5网络改进的车辆检测算法，其特征在于：输入3通道的640*640的图片，经Focus切片操作后输出（3，32，320，320），后连接Conv输出（32，64，160，160），连接层BottlenecCSP1-1输出（64，64，160，160），连接Conv层输出（64，128，80，80），连接DenseBlockCSP1_3层输出（128，128，80，80），连接层Conv输出（1128，256，40，40），连接DenseBlockCSP1_3输出（256，256，40，40），连接层Conv输出（256，512，20，20），连接层SPP输出（512，512，20，20）。

3.根据权利要求1中所述的一种基于YOLOv5网络改进的车辆检测算法，其特征在于：所述步骤（3）中，经前层SPP输出（512，512，20，20）；之后连接Transformer层，Transformer中，数据首先会经过一个Multi-Head attention的模块，该模块包括8个self-Attention，得到8个加权之后的特征矩阵；将8个按列拼成一个大的特征矩阵；经Multi-Head attention输出之后经过一个全连接层（Feed Forward Neural Network），这个全连接有两层，第一层的激活函数是ReLU，第二层是一个线性激活函数，最终经Transformer层输出（512，512，20，20）；最后将主干网络的输出经neck部分进行多尺度特征的融合。

4.根据权利要求1中所述的一种基于YOLOv5网络改进的车辆检测算法，其特征在于：所述步骤（4）中，设置迭代次数epoch为300，batch-size为4，初始学习率为0.01，经过300次迭代训练，损失值与平均精度（AP）均趋于稳定，保存此时的最佳模型参数；

模型测试采用的模型评价指标精准率（Precision）、召回率（Recall）、平均精度（AP）如下：

其中，为将正类预测为正类的数，为将正类预测为负类的数，为将负类预测为正类的数，为将负类预测为负类的数，Precision即正确检测到的样本数占总样本数的比例，Recall即正确检测到的样本数占真实样本数的比例，平均精度（AP）即在不同下的最高的均值。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于哈尔滨理工大学，未经哈尔滨理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202210352291.5/1.html，转载请声明来源钻瓜专利网。

上一篇：一种妇科护理用导管式给药装置
下一篇：一种用于海洋测量的光敏电池触发型防水GPS定位装置

同类专利

专利分类

G 物理

G06 计算；推算；计数

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于YOLOv5改进的车辆检测与识别方法在审

专利文献下载