[发明专利]基于遗传算法的可选择数据增强方法及系统有效
| 申请号: | 202111175442.6 | 申请日: | 2021-10-09 |
| 公开(公告)号: | CN113887636B | 公开(公告)日: | 2023-04-07 |
| 发明(设计)人: | 魏骁勇;马跃;张栩禄;杨震群 | 申请(专利权)人: | 四川大学 |
| 主分类号: | G06F18/214 | 分类号: | G06F18/214;G06F18/2415;G06N3/045 |
| 代理公司: | 成都正煜知识产权代理事务所(普通合伙) 51312 | 代理人: | 徐金琼 |
| 地址: | 610065 四川*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 遗传 算法 可选择 数据 增强 方法 系统 | ||
1.一种基于遗传算法的可选择数据增强方法,其特征在于,包括:
步骤1:获取数据集,包括训练集和验证集;
步骤2:搭建一个图像分类网络模型和两个选择神经网络,两个选择神经网络输出各数据增强方式及其参数的候选值的选择概率以供图像分类网络模型训练前进行选择、生成初始种群和得到初始种群归一化后的整体概率,其中,初始种群由多个图像分类网络模型组成,初始种群大小自定义,各数据增强方式包括图像翻转、旋转、平移、错切、亮度调整和对比度调整,数据增强方式的参数包括翻转的翻转概率、旋转的旋转角度、平移的范围大小、错切的角度、亮度的调整幅度和对比度的调整幅度;
步骤3:基于训练集并行训练初始种群中各图像分类网络模型,并基于训练过程中各分类网络模型的输出训练两个选择神经网络;
步骤4:训练集中的图像全部输入各图像分类网络模型后,使用验证集验证训练后的各图像分类网络模型,得到各图像分类网络模型的准确率;
步骤5:若各图像分类网络模型的准确率满足给定条件,得到训练好的图像分类网络模型和两个选择神经网络,同时得到两个选择神经网络的输出结果,即得到各数据增强方式及各数据增强方式的参数的候选值的选择概率,否则转到步骤6;
步骤6:基于遗传算法和两个选择神经网络输出的选择概率构建新种群,基于新种群转到步骤3再次进行训练;
所述步骤2中的图像分类网络模型为主流网络模型;
两个选择神经网络为选择神经网络A和选择神经网络B,都为单层神经网络结构,输入为人为设定的固定值,且输入维度要小于输出维度;
选择神经网络A的输出维度为候选的数据增强方式的个数,选择神经网络A的输出为各数据增强方式的选择概率,其中,数据增强方式的个数基于经验进行选择;
选择神经网络B的输出维度为候选的数据增强方式的个数乘以各数据增强方式的参数的候选个数,选择神经网络B的输出为各数据增强方式的参数的每个候选值对应的选择概率;
基于两个选择神经网络生成图像分类网络模型种群,即生成初始种群:初始种群由多个图像分类网络模型组成,而初始种群中每个图像分类网络模型的数据增强方式及其参数的候选值由两个选择神经网络随机选择生成,初始种群中每个图像分类网络模型选择两种数据增强方式,具体为:选择神经网络A的输出为各数据增强方式的选择概率,其中,初始的选择神经网络A的选择概率都为1/M,所有数据增强方式的选择概率相加为1,所以所选择的两种数据增强的选择概率为ri1=ri2=1/M,表示初始种群中各图像分类网络模型的编号;随机生成(0,1)之间的浮点数,将选择神经网络A输出的各数据增强方式的选择概率依次相加,相加之和首次大于随机浮点数时,此时最后做加法的选择概率对应的数据增强方式即为选择到的第一种数据增强方式,第二数据增强方式按照同样的方式进行选择,若选择结果和第一种相同,则重新选择,若重复选择10次结果皆与第一种相同,则第二种数据增强方式默认选择下一个选择概率对应的数据增强方式;
选择神经网络B的输出为各数据增强方式的参数的候选值的选择概率,初始都为1/N,选择数据增强方式的参数的候选值的选择概率的方式与选择神经网络A选择数据增强方式的方式相同;
基于图像分类模型选择的两种数据增强方式及参数的候选值得到初始种群中各图像分类网络模型的整体概率,处理后得到归一化后的概率wi;具体为:随机选择的两种数据增强方式对应选择神经网络A的选择概率分别为ri1,ri2,各数据增强方式的参数对应选择神经网络B的选择概率分别为pi11,pi21,则图像分类网络模型所选的数据增强方式的整体概率为ri1×ri2×pi11×pi21,基于上述方式,再基于初始种群中的各图像分类网络模型的两种数据增强方式及参数的候选值的选择概率进行归一化处理,得到各图像分类网络模型对应的归一化后的整体概率wi,即指权重wi;
所述步骤3的具体步骤为:
图像分类网络模型训练过程中,将各图像分类网络模型的输出乘对应的权重wi加权求和作为新预测值;基于新预测值进行最小化损失函数处理,反向传播可求得两个选择神经网络的权值的梯度,再通过梯度下降更新两个选择神经网络,新预测值的具体公式如下:
其中,是各图像分类网络模型的输出,表示各图像分类网络模型的输入,为加权求和后的新预测值,为初始种群的大小,表示初始种群中各图像分类网络模型的编号,为各图像分类网络模型归一化后得到的整体概率,, 。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111175442.6/1.html,转载请声明来源钻瓜专利网。





