[发明专利]一种交通目标检测模型的压缩方法和系统在审
申请号: | 202210423887.X | 申请日: | 2022-04-22 |
公开(公告)号: | CN114550122A | 公开(公告)日: | 2022-05-27 |
发明(设计)人: | 张超;万亚东;张波 | 申请(专利权)人: | 科大天工智能装备技术(天津)有限公司;北京科技大学 |
主分类号: | G06V20/56 | 分类号: | G06V20/56;G06V10/25;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 北京高沃律师事务所 11569 | 代理人: | 王爱涛 |
地址: | 300308 天津市东丽区*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 交通 目标 检测 模型 压缩 方法 系统 | ||
本发明涉及一种交通目标检测模型的压缩方法和系统,属于目标检测模型压缩技术领域。本发明提供的交通目标检测模型的压缩方法,通过采用注意力机制转移模块和激活信息转移模块使得结构简单的学生模型可以从复杂的老师模型中提取有用的特征信息,能够减小交通目标检测模型复杂度的同时,保持交通目标检测模型的检测性能。在实际应用过程中,采用这种方法能够利用激活信息和注意力机制信息的联合机制来改善复杂度较低的网络模型的检测性能,从而可以辅助驾驶员进行安全驾驶。
技术领域
本发明涉及目标检测模型压缩技术领域,特别是涉及一种交通目标检测模型的压缩方法和系统。
背景技术
深度学习网络在目标检测任务上取得了前所未有的效果,随着网络宽度和深度的加深,复杂的模型带来了诸如高额存储空间、大量计算资源,难以落地到各个硬件平台等问题,而且复杂的模型会增加模型的推理时间,降低模型实时检测性能,这些在对于高精度、实时性要求较强的交通目标检测中显得尤为关键。减小模型的复杂度的同时保持模型的检测性能成为一个需要解决的问题,这对于交通目标的实时检测从而实现安全驾驶有着至关重要的作用。
发明内容
为解决现有技术存在的上述问题,本发明提供了一种交通目标检测模型的压缩方法和系统。
为实现上述目的,本发明提供了如下方案:
一种交通目标检测模型的压缩方法,包括:
将老师模型提取的特征和学生模型提取的特征均输入至注意力机制转移模块中得到特征转移模块信息;所述老师模型为待压缩的交通目标检测模型;所述学生模型为预设模型;
将老师模型提取的特征和学生模型提取的特征均输入至激活信息转移模块中得到激活转移模块信息;
根据所述特征转移模块信息确定注意力机制转移模块的损失函数;
根据所述激活转移模块信息确定激活信息转移模块的损失函数;
根据所述注意力机制转移模块的损失函数和所述激活信息转移模块的损失函数生成总损失函数;
将预设图像数据分别输入老师模型和学生模型,直至所述总损失函数的值不变时,完成所述老师模型的压缩。
优选地,所述特征转移模块信息为:
;
其中,X为输入信息,为激活函数,
优选地,所述激活转移模块信息为y:
;
其中,
优选地,所述注意力机制转移模块的损失函数为老师模型的特征转移模块信息与学生模型的特征转移模块信息的平方差。
优选地,所述激活信息转移模块的损失函数为老师模型的激活转移模块信息与学生模型的激活转移模块信息的平方差。
优选地,所述总损失函数为所述注意力机制转移模块的损失函数与2倍的激活信息转移模块的损失函数的和。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明提供的交通目标检测模型的压缩方法,通过采用注意力机制转移模块和激活信息转移模块使得结构简单的学生模型可以从复杂的老师模型中提取有用的特征信息,能够减小交通目标检测模型复杂度的同时,保持交通目标检测模型的检测性能。在实际应用过程中,采用这种方法能够利用激活信息和注意力机制信息的联合机制来改善复杂度较低的网络模型的检测性能,从而可以辅助驾驶员进行安全驾驶。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大天工智能装备技术(天津)有限公司;北京科技大学,未经科大天工智能装备技术(天津)有限公司;北京科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210423887.X/2.html,转载请声明来源钻瓜专利网。