[发明专利]一种基于YOLO的Compress-YOLO模型压缩方法有效
申请号: | 201910062805.1 | 申请日: | 2019-01-23 |
公开(公告)号: | CN109816097B | 公开(公告)日: | 2022-12-09 |
发明(设计)人: | 颜云辉;王森;宋克臣;赵凯歌 | 申请(专利权)人: | 东北大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 沈阳东大知识产权代理有限公司 21109 | 代理人: | 李在川 |
地址: | 110819 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种基于YOLO的Compress‑YOLO模型压缩方法,包括设计Compress‑YOLO神经网络特征提取部分、使用GoogLeNet的特征提取部分对输入图像进行特征提取、使用Compress‑YOLO模型中的两层全卷积层取代YOLO中的两层全连接层、使用一层卷积层对bounding box进行回归、通过reshape层对输出维度进行调整,使得输出维度和YOLO的输出维度相同以及选择PASCAL VOC 2012数据集对设计的Compress‑YOLO神经网络模型进行训练;针对训练中出现的过拟合现象,采用Batch Normaliztion层和Scale层组合的方法。本发明提供的基于YOLO的Compress‑YOLO模型压缩方法,可以在尽量保证模型性能的同时可以将深度学习部署到嵌入式设备上,且更加密集、计算量更小,提高了网络的性能。 | ||
搜索关键词: | 一种 基于 yolo compress 模型 压缩 方法 | ||
【主权项】:
1.一种基于YOLO的Compress‑YOLO模型压缩方法,其特征在于,包括以下步骤:步骤1、设计Compress‑YOLO神经网络特征提取部分,YOLO的输入尺寸固定为448×448,当识别种类为A种,每个网格预测两个种类时,输出维度为B;1.1安装和配置Caffe框架,添加Caffe路径到系统环境;1.2对Caffe框架的数据层进行修改,添加YOLO‑Data层,在该层中添加side成员,将输入的图片划分为7×7的网格;1.3将输入图片尺寸调整到448×448大小,获得列表、标签数据,并将图片数据转化为LMDB格式,输出维度即为B;步骤2、使用GoogLeNet的特征提取部分对输入图像进行特征提取,使用GoogLeNet将提取出特征的第一个卷积层到inception(5b)部分取代原始YOLO中的12组3×3和1×1的卷积层,每组包括一个3×3和一个1×1的卷积层;步骤3、成对使用卷积神经网络中补充使用的实用化层:Batch Normalization层和Scale层,并添加池化层;步骤4、使用Compress‑YOLO模型中的两层全卷积层取代YOLO中的两层全连接层,一层预测目标的种类,一层预测bounding box的坐标;步骤5、使用一层卷积层对bounding box进行回归;步骤6、通过reshape层使得输出维度和YOLO的输出维度B相同;步骤7、选择PASCAL VOC 2012数据集对设计的Compress‑YOLO神经网络模型进行训练;7.1对Caffe框架的数据层进行修改,添加YOLO‑Data层,计算训练过程中的Compress‑YOLO模型随迭代次数增加的损失;7.2在正式训练时,采用分段设置学习率的方式,分别在迭代次数为540、16020和24020时改变训练学习率。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910062805.1/,转载请声明来源钻瓜专利网。