[发明专利]一种可用于标签生成的水下场景目标检测集成方法及系统有效
申请号: | 202010400657.2 | 申请日: | 2020-05-13 |
公开(公告)号: | CN111666979B | 公开(公告)日: | 2023-09-08 |
发明(设计)人: | 潘诚伟;陈子一 | 申请(专利权)人: | 北京科技大学 |
主分类号: | G06F18/214 | 分类号: | G06F18/214;G06F18/25;G06N3/0464 |
代理公司: | 北京市广友专利事务所有限责任公司 11237 | 代理人: | 张仲波 |
地址: | 100083*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 标签 生成 水下 场景 目标 检测 集成 方法 系统 | ||
1.一种可用于标签生成的水下场景目标检测集成方法,其特征在于,所述可用于标签生成的水下场景目标检测集成方法包括:
利用已有的训练集对多个模型进行训练;
利用训练好的多个模型分别对无标签的样本进行预测,并采用预设集成策略将每个模型对同一个样本的预测结果进行集成,生成该样本的标签;
将生成标签的样本加入训练集中,用新生成的训练集重新训练每一模型;
所述多个模型包括一个主模型和多个辅助模型;其中,
所述主模型为以ResNeXt101-64x4d为骨干网络的Cascade R-CNN;
所述辅助模型包括以HRNetv2p-w48为骨干网络的Cascade R-CNN和以SEResNeXt101-32x4d为骨干网络的Cascade R-CNN;
所述利用已有的训练集对多个模型进行训练,包括:
对每个模型的训练集分别按照预设方式进行随机变换;
利用随机变换后的训练集分别对每一模型进行训练;
所述对每个模型的训练集分别按照预设方式进行随机变换,包括:
对每个模型的训练集分别随机选择左右抖动,随机裁剪,色彩空间变换以及引入噪声中的任意一种或多种的组合进行随机变换;
所述利用随机变换后的训练集分别对每一模型进行训练,包括:
为每一种模型都在COCO数据集上进行预训练来加速模型的收敛;
在训练的不同周期把训练样本的短边随机缩放到600到1200之间,同时保持图像的长宽比不变,对每个模型都设置不同的测试尺度;其中,
对于HRNetv2p-w48,将测试样本的短边分别缩放到1200和1000并进行两次测试,再用softnms的方法将两次测试结果融合;而对ResNeXt101-64x4d和SEResNeXt101-32x4d,将测试样本的短边分别缩放到600,800,1100并分别进行两次测试,再分别用softnms的方法将各模型的两次测试结果融合;
所述利用训练好的多个模型分别对无标签的样本进行预测,包括:
对于每一无标签的样本,分别按照预设方式进行随机变换;
将变换后的每一样本分别输入每一训练好的模型中进行预测;其中,每个所述辅助模型都使用同一样本通过不同变换方式随机变换后生成的样本;
所述采用预设集成策略将每个模型对同一个样本的预测结果进行集成,生成该样本的标签,包括:
针对所述主模型和辅助模型对同一样本的预测结果,遍历所述主模型的预测结果,选取其中置信度大于0.1的检测框;
从所述辅助模型的预测结果中选取置信度大于0.1且与所述主模型的检测框交并比大于0.7并属于同一检测类别的检测框;
将从所述主模型的预测结果中选取的检测框和从所述辅助模型的预测结果中选取的检测框进行置信度和坐标上的平均,以生成该样本更精确的标签;
所述采用预设集成策略将每个模型对同一个样本的预测结果进行集成,生成该样本的标签,还包括:
将集成后的预测结果中置信度大于0.3的检测框作为对应样本的标签。
2.如权利要求1所述的可用于标签生成的水下场景目标检测集成方法,其特征在于,所述方法还包括:
迭代执行模型训练和标签生成过程,以提高模型精度和生成标签的精度。
3.一种可用于标签生成的水下场景目标检测集成系统,其特征在于,所述可用于标签生成的水下场景目标检测集成系统包括:
模型训练模块,用于利用已有的训练集对多个模型进行训练;
模型集成模块,用于利用训练好的多个模型分别对无标签的样本进行预测,并采用预设集成策略将每个模型对同一个样本的预测结果进行集成,生成该样本的标签;
迭代模块,用于将生成标签的样本加入训练集中,用新生成的训练集重新训练每一模型;
所述多个模型包括一个主模型和多个辅助模型;其中,
所述主模型为以ResNeXt101-64x4d为骨干网络的Cascade R-CNN;
所述辅助模型包括以HRNetv2p-w48为骨干网络的Cascade R-CNN和以SEResNeXt101-32x4d为骨干网络的Cascade R-CNN;
所述利用已有的训练集对多个模型进行训练,包括:
对每个模型的训练集分别按照预设方式进行随机变换;
利用随机变换后的训练集分别对每一模型进行训练;
所述对每个模型的训练集分别按照预设方式进行随机变换,包括:
对每个模型的训练集分别随机选择左右抖动,随机裁剪,色彩空间变换以及引入噪声中的任意一种或多种的组合进行随机变换;
所述利用随机变换后的训练集分别对每一模型进行训练,包括:
为每一种模型都在COCO数据集上进行预训练来加速模型的收敛;
在训练的不同周期把训练样本的短边随机缩放到600到1200之间,同时保持图像的长宽比不变,对每个模型都设置不同的测试尺度;其中,
对于HRNetv2p-w48,将测试样本的短边分别缩放到1200和1000并进行两次测试,再用softnms的方法将两次测试结果融合;而对ResNeXt101-64x4d和SEResNeXt101-32x4d,将测试样本的短边分别缩放到600,800,1100并分别进行两次测试,再分别用softnms的方法将各模型的两次测试结果融合;
所述利用训练好的多个模型分别对无标签的样本进行预测,包括:
对于每一无标签的样本,分别按照预设方式进行随机变换;
将变换后的每一样本分别输入每一训练好的模型中进行预测;其中,每个所述辅助模型都使用同一样本通过不同变换方式随机变换后生成的样本;
所述采用预设集成策略将每个模型对同一个样本的预测结果进行集成,生成该样本的标签,包括:
针对所述主模型和辅助模型对同一样本的预测结果,遍历所述主模型的预测结果,选取其中置信度大于0.1的检测框;
从所述辅助模型的预测结果中选取置信度大于0.1且与所述主模型的检测框交并比大于0.7并属于同一检测类别的检测框;
将从所述主模型的预测结果中选取的检测框和从所述辅助模型的预测结果中选取的检测框进行置信度和坐标上的平均,以生成该样本更精确的标签;
所述采用预设集成策略将每个模型对同一个样本的预测结果进行集成,生成该样本的标签,还包括:
将集成后的预测结果中置信度大于0.3的检测框作为对应样本的标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京科技大学,未经北京科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010400657.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种碳纤维布生产用断裂强度检测装置
- 下一篇:一种信息化矿灯在矿井应用的方法