[发明专利]神经网络训练方法及装置、电子设备及可读存储介质在审
申请号: | 202110342814.3 | 申请日: | 2021-03-30 |
公开(公告)号: | CN115146772A | 公开(公告)日: | 2022-10-04 |
发明(设计)人: | 郭同;胡懋地 | 申请(专利权)人: | 北京三快在线科技有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06F16/35 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 任亚娟 |
地址: | 100083 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 训练 方法 装置 电子设备 可读 存储 介质 | ||
1.一种神经网络训练方法,其特征在于,包括:
获取第一训练特征以及第二训练特征,其中,所述第二训练特征与所述第一训练特征为相似特征;
根据所述第一结果以及所述第二结果确定训练损失,其中,所述第一结果是由目标神经网络对第一训练特征进行预测得到的,所述第二结果是由目标神经网络对第二训练特征进行预测得到的;
根据所述训练损失对所述目标神经网络进行训练。
2.根据权利要求1所述的方法,其特征在于,所述目标神经网络为文本识别模型,所述第一训练特征以及所述第二训练特征为文本,其中,
获取第一训练特征以及第二训练特征,包括以下至少之一:
对所述第一训练特征中的词进行数据增强,以得到所述第二训练特征;
对所述第一训练特征中的短语进行数据增强,以得到所述第二训练特征;
对所述第一训练特征中的语句进行数据增强,以得到所述第二训练特征。
3.根据权利要求1或2所述的方法,其特征在于,根据所述第一结果以及所述第二结果确定训练损失,包括:
在所述第一训练特征与所述第二训练特征为词不同的情况下,对所述第一结果以及所述第二结果进行互斥,以得到词训练损失。
4.根据权利要求1或2所述的方法,其特征在于,根据所述第一结果以及所述第二结果确定训练损失,包括:
在所述第一训练特征与所述第二训练特征为短语不同的情况下,对所述第一结果以及所述第二结果进行互斥,以得到短语训练损失。
5.根据权利要求1或2所述的方法,其特征在于,根据所述第一结果以及所述第二结果确定训练损失,包括:
在所述第一训练特征与所述第二训练特征为语句不同的情况下,对所述第一结果以及所述第二结果进行互斥,以得到语句训练损失。
6.根据权利要求1或2所述的方法,其特征在于,根据所述第一结果以及所述第二结果确定训练损失,包括:
将所述第二结果输入至预设解码器,以得到所述预设解码器对应的第一解码损失。
7.根据权利要求6所述的方法,其特征在于,根据所述第一结果以及所述第二结果确定训练损失,还包括:
对所述第一结果以及所述解码损失进行吸引,以得到第二解码损失。
8.一种神经网络训练装置,其特征在于,包括:
获取单元,用于获取第一训练特征以及第二训练特征,其中,所述第二训练特征与所述第一训练特征为相似特征;
确定单元,用于根据所述第一结果以及所述第二结果确定训练损失,其中,所述第一结果是由目标神经网络对第一训练特征进行预测得到的,所述第二结果是由目标神经网络对第二训练特征进行预测得到的;
训练单元,用于根据所述训练损失对所述目标神经网络进行训练。
9.一种电子设备,其特征在于,包括处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1-7所述的神经网络训练方法的步骤。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1-7所述的神经网络训练方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110342814.3/1.html,转载请声明来源钻瓜专利网。