[发明专利]神经网络训练及分类方法、系统、设备和介质在审
申请号: | 202110763491.5 | 申请日: | 2021-07-06 |
公开(公告)号: | CN115587619A | 公开(公告)日: | 2023-01-10 |
发明(设计)人: | 赵佳鹏 | 申请(专利权)人: | 广州视源电子科技股份有限公司;广州视源人工智能创新研究院有限公司 |
主分类号: | G06N3/0464 | 分类号: | G06N3/0464;G06N3/045;G06N3/08;G06F18/241 |
代理公司: | 广州润禾知识产权代理事务所(普通合伙) 44446 | 代理人: | 林伟斌 |
地址: | 510530 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 训练 分类 方法 系统 设备 介质 | ||
1.一种神经网络训练方法,其特征在于,包括:
利用若干个初训练样本对第一卷积神经网络进行训练,得到训练后的第一卷积神经网络;所述若干个初训练样本分为若干个类别;
将所述初训练样本输入所述训练后的第一卷积神经网络,得到所述初训练样本的分类结果,根据所述初训练样本的分类结果在所述初训练样本中筛选出易分类样本;
根据所有所述易分类样本确定每个所述类别的中心模板;
根据所述中心模板构造第二卷积神经网络的损失函数;利用所述初训练样本对所述第二卷积神经网络进行训练,得到训练后的第二卷积神经网络;
所述第一卷积神经网络的数量级小于所述第二卷积神经网络的数量级。
2.根据权利要求1所述的神经网络训练方法,其特征在于,利用所述中心模板所构造的损失函数用于使每个所述初训练样本与其对应的类别的中心模板之间的距离保持小于或等于第一阈值,同时使每个所述初训练样本与其非对应的类别的中心模板之间的距离保持大于或等于第二阈值。
3.根据权利要求1所述的神经网络训练方法,其特征在于,根据所述初训练样本的分类结果在所述初训练样本中筛选出所有类别的易分类样本,具体为:
在所述初训练样本的分类结果中判断每个所述初训练样本的分类结果是否符合其对应的类别,将符合所述判断的分类结果对应的初训练样本作为所述初训练样本中的易分类样本。
4.根据权利要求1所述的神经网络训练方法,其特征在于,每个所述类别的初训练样本中包含至少三个所述易分类样本;
根据所有所述易分类样本确定每个所述类别的中心模板,具体为:确定每个所述易分类样本与同一类别中其他易分类样本之间的距离之和,将所述与同一类别中其他易分类样本之间的距离之和最小的易分类样本作为其对应的类别的中心模板。
5.根据权利要求2所述的神经网络训练方法,其特征在于,所述损失函数具体为:
L=λ1*Lcp+λ2*Lcn;
其中,所述Lcp和所述Lcn满足[X]+=max(0,X);
所述L为所述损失函数;
所述Lcp为基于每个所述初训练样本与其对应的类别的中心模板之间的距离所构成的损失函数;所述Lcn为基于每个所述初训练样本与其非对应的类别的中心模板之间的距离所构成的损失函数;
所述b为所述初训练样本的总数量,所述初训练样本的向量为x1,x2……xb;
所述初训练样类别本中分为n(n≤b)个类别,n个类别的初训练样本的数量分别为m1,m2……mn;n个类别的中心模板的向量分别是c1、c2……cn,所述c1、c2……cn一一对应所述m1,m2……mn;所述i和所述j为参数的当前顺序;
所述δcp为所述第一阈值;所述δcn为所述第二阈值;所述λ1和所述λ2为权重系数。
6.根据权利要求5所述的神经网络训练方法,其特征在于,所述δcp的值为0。
7.根据权利要求4所述的神经网络训练方法,其特征在于,
确定每个所述易分类样本与同一类别的其他易分类样本之间的距离之和,具体为:获取并根据每个所述易分类样本经过所述第一卷积神经网络的Softmax层后的向量,确定每个所述易分类样本与同一类别的其他易分类样本之间的距离之和。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州视源电子科技股份有限公司;广州视源人工智能创新研究院有限公司,未经广州视源电子科技股份有限公司;广州视源人工智能创新研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110763491.5/1.html,转载请声明来源钻瓜专利网。