[发明专利]一种基于动态强度的物体检测神经网络混合训练方法及系统有效
申请号: | 202010104069.4 | 申请日: | 2020-02-20 |
公开(公告)号: | CN111260060B | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 何发智;全权;李博文;邓杰希;舒凌轩 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06N3/08 | 分类号: | G06N3/08 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 罗飞 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 动态 强度 物体 检测 神经网络 混合 训练 方法 系统 | ||
本发明公开了一种基于动态强度的物体检测神经网络混合训练方法,缓解了检测网络的数据记忆问题,改善了检测网络的在测试集上的泛化性。通过构建混合数据,一定程度扩充了数据集,并且额外添加了不同类别数据间的线性关系,提升了模型的表现力。而通过动态混合参数的设置,降低了混合训练方法在检测网络上的训练难度,平滑了训练过程,从而更容易得到最优模型。相比于其他训练方法,训练出的模型具有更好的泛化性。
技术领域
本发明涉及计算机应用、计算机视觉技术领域,涉及一种神经网络优化方法,具体涉及一种基于动态强度的物体检测神经网络混合训练方法及系统。
背景技术
神经网络是一种处理计算机视觉问题的一种常见方法。其主要通过卷积层、池化层、全连接层、激活函数等组件以某种方式组合成一个网络,再以足量的任务相关的数据对网络进行训练。当网络得到足够的训练,能够处理训练数据以外的数据时便表示网络已经训练完成。此时得到的网络便可以作为一个黑盒函数用以解决我们的问题。
神经网络的训练方法指的是神经网络训练时所采取的训练策略,当神经网络采取不同的训练策略时可能最后会得到效果不同的模型。训练方法一般包括几个部分:数据预处理,训练用的辅助网络,损失函数。其中每一个部分的改动都会影响神经网络的训练过程及最后的结果。
本申请发明人在实施本发明的过程中,发现现有技术的方法,至少存在如下技术问题:
现有的训练方法过分依赖于原始数据集,训练难度较大。
发明内容
有鉴于此,本发明提供了一种基于动态强度的物体检测神经网络混合训练方法及系统,用以解决或者至少部分解决现有技术中现有的训练方法过分依赖于原始数据集,训练难度较大的技术问题。
为了解决上述技术问题,本发明第一方面提供了一种基于动态强度的物体检测神经网络混合训练方法,包括:
S1:构建物体检测神经网络,并初始化物体检测神经网络的所有参数;
S2:获取原始训练数据,并对原始训练数据进行预处理,其中,原始训练数据包括图像数据和标签数据,标签数据包括图像内所有的标记物体的类别信息和位置信息;
S3:获取动态混合参数,从预处理后的训练数据中随机选取第一数据和第二数据,将动态混合参数作为混合强度调节参数对选取出的第一数据和第二数据进行混合,获得混合后的数据对,其中,混合后的数据对包括混合后的图像数据、第一数据对应的标签数据以及第二数据对应的标签数据;
S4:基于混合后的数据对获得扩展后的数据集;
S5:根据扩展后的数据集中的混合数据、第一数据对应的标签数据以及第二数据对应的标签数据,设置目标混合损失函数,其中,目标混合损失函数包括分类损失和位置损失;
S6:将扩展后的数据集作为训练数据,结合混合损失函数,采用随机梯度下降法对物体检测神经网络进行训练,得到训练好的物体检测神经网络。
在一种实施方式中,S1包括:
S1.1:使用卷积层、全连接层、池化层、激活层构建神经网络或者使用现有的神经网络作为物体检测神经网络;
S1.2:采用随机参数初始化方法初始化物体检测神经网络的所有参数。
在一种实施方式中,S2中对原始训练数据进行预处理,具体包括:
S2.1:对原始训练数据中的图像数据进行像素值归一化;
S2.2:进行图片裁剪;
S2.3:进行图片翻转。
在一种实施方式中,S3具体包括:
S3.1:根据公式生成动态混合参数λ,具体公式如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010104069.4/2.html,转载请声明来源钻瓜专利网。