[发明专利]目标识别模型建立方法及装置有效
申请号: | 201811320140.1 | 申请日: | 2018-11-07 |
公开(公告)号: | CN109522949B | 公开(公告)日: | 2021-01-26 |
发明(设计)人: | 朱力强;余祖俊;宁滨;郭保青;王尧 | 申请(专利权)人: | 北京交通大学;中国铁路总公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 吴迪 |
地址: | 100044*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 识别 模型 建立 方法 装置 | ||
1.一种图像目标分类模型建立方法,其特征在于,所述方法包括:
根据目标场景中的图像目标分类实时性要求,计算深度卷积神经网络包含的最大卷积核数量N1;
构建深度卷积神经网络模型,其中,所述深度卷积神经网络模型的卷积核数量N2大于N1,所述深度卷积神经网络模型的参数通过随机初始化获得,或者利用预训练数据库通过预训练获得;其中,所述预训练数据库包含其它场景和/或所述目标场景的图像样本;
以所述目标场景的图像样本集作为训练数据库,对所述深度卷积神经网络模型进行一次压缩训练,得到所述深度卷积神经网络的压缩模型,该压缩模型的卷积核数量N3小于N2;
当N3大于N1或者当得到的压缩模型的目标分类准确率高于预期分类准确率时,对得到的压缩模型重复进行压缩训练,直至N3不大于N1且得到的压缩模型的目标分类准确率不高于预期分类准确率时为止;将最终获得的压缩模型作为图像目标分类模型,以对所述目标场景中的图像进行目标分类识别;
所述压缩训练包括如下步骤:
利用训练样本数据库对所述深度卷积神经网络模型进行训练,在训练结束后,对所述深度卷积神经网络进行一次剪枝;
所述对所述深度卷积神经网络进行一次剪枝,包括:
向所述深度卷积神经网络模型输入训练样本;
针对所述深度卷积神经网络模型中的每个卷积层,计算所述卷积层中的各卷积核输出的特征图的Ln范数,其中n≥0;
对所述Ln范数值进行由大至小排列,删除所述Ln范数值小于预设门限值的冗余卷积核,或者删除排序在预设门限值后面的冗余卷积核,实现所述深度卷积神经网络的压缩;
利用训练样本数据库对压缩过的深度卷积神经网络模型进行再训练,以完成一次剪枝。
2.根据权利要求1所述的方法,其特征在于,从所述卷积层中删除所述冗余卷积核,包括:
提取深度预训练网络中的参数连接值,所述参数连接值包括所述深度预训练网络中各层的权重值和偏置连接值;
从获取到的参数连接值中删除与所述冗余卷积核对应的位置处的参数连接值;
从所述卷积层连接的下一层的输入通道中,删除与所述冗余卷积核对应的输入通道。
3.根据权利要求1所述的方法,其特征在于,对压缩过的深度卷积神经网络的再训练过程包括:
冻结所述压缩过的深度卷积神经网络的卷积层的权重值,对所述压缩过的深度卷积神经网络的其他层的权重值进行训练,直至准确率不再升高;
在对所述压缩过的深度卷积神经网络的所述其他层的权重值进行训练之后,对所述压缩过的深度卷积神经网络的各层的权重值进行训练,直至准确率收敛,得到所述压缩模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京交通大学;中国铁路总公司,未经北京交通大学;中国铁路总公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811320140.1/1.html,转载请声明来源钻瓜专利网。