[发明专利]模型的训练方法、数据处理方法、装置、电子设备及介质在审
申请号: | 202210315455.7 | 申请日: | 2022-03-29 |
公开(公告)号: | CN114662688A | 公开(公告)日: | 2022-06-24 |
发明(设计)人: | 尉德利 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04;G06K9/62 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 杨静 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 数据处理 装置 电子设备 介质 | ||
1.一种数据处理模型的训练方法,包括:
确定样本数据的有效样本数据,得到有效样本数据,其中,所述有效样本数据的长度是有效样本长度;
对所述有效样本数据进行剪枝,得到剪枝样本数据;
对所述剪枝样本数据进行填充,得到中间样本数据;
对所述中间样本数据中的填充数据进行掩码,得到目标样本数据;以及
利用目标样本数据序列训练深度学习模型,得到所述数据处理模型,其中,所述目标样本数据序列包括多个所述目标样本数据。
2.根据权利要求1所述的方法,其中,所述确定样本数据各自的有效样本数据,得到有效样本数据,包括:
针对所述样本数据序列包括的多个样本数据中的每个样本数据,
确定所述样本数据中的未被填充数据;以及
根据所述未被填充数据,得到所述有效样本数据。
3.根据权利要求2所述的方法,其中,所述确定所述样本数据中的未被填充数据,包括:
根据所述样本数据与第一预定数据进行相乘得到的结果,确定所述样本数据中的未被填充数据。
4.根据权利要求1~3中任一项所述的方法,其中,所述对所述有效样本数据进行剪枝,得到剪枝样本数据,包括:
确定所述有效样本数据中对象数据的权重系数;以及
基于预定剪枝系数和所述有效样本数据中对象数据的权重系数,对所述有效样本数据进行剪枝,得到所述剪枝样本数据。
5.根据权利要求1~4中任一项所述的方法,其中,所述对所述剪枝样本数据进行填充,得到中间样本数据,包括:
在确定所述剪枝样本数据的样本长度小于预期样本长度的情况下,对所述剪枝样本数据的末尾填充第二预定数据,得到所述中间样本数据,其中,所述预期样本长度为最大样本长度或预定样本长度,所述最大样本长度是与所述样本数据对应的剪枝样本序列中多个所述剪枝样本数据各自的样本长度中的最大值。
6.根据权利要求5所述的方法,其中,所述对所述中间样本数据中的填充数据进行掩码,得到目标样本数据,包括:
在确定所述中间样本数据包括被填充的所述第二预定数据的情况下,对所述第二预定数据进行掩码,得到掩码数据;以及
根据所述掩码数据和所述中间样本数据中的有效样本数据,得到所述目标样本数据。
7.根据权利要求1~6中任一项所述的方法,其中,所述样本数据包括以下一项:样本文本数据和样本音频数据。
8.根据权利要求1~7中任一项所述的方法,其中,所述深度学习模型包括Transformer。
9.一种数据处理方法,包括:
对待处理数据序列进行剪枝,得到剪枝数据序列;以及
将所述剪枝数据序列输入所述数据处理模型,得到数据处理结果,
其中,所述数据处理模型是利用根据权利要求1~8中任一项所述的方法训练得到的。
10.一种数据处理模型的训练装置,包括:
确定模块,用于确定样本数据的有效样本数据,得到有效样本数据,其中,所述有效样本数据的长度是有效样本长度;
第一剪枝模块,用于对所述有效样本数据进行剪枝,得到剪枝样本数据;
填充模块,用于对所述剪枝样本数据进行填充,得到中间样本数据;
掩码模块,用于对所述中间样本数据中的填充数据进行掩码,得到目标样本数据;以及
训练模型,用于利用目标样本数据序列训练深度学习模型,得到所述数据处理模型。
11.根据权利要求10所述的装置,其中,所述确定模块,包括:
第一确定子模块,用于确定所述样本数据中的未被填充数据;以及
第一获得子模块,用于根据所述未被填充数据,得到所述有效样本数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210315455.7/1.html,转载请声明来源钻瓜专利网。