[发明专利]模型训练方法和设备在审
申请号: | 201911326890.4 | 申请日: | 2019-12-20 |
公开(公告)号: | CN112002309A | 公开(公告)日: | 2020-11-27 |
发明(设计)人: | 罗辉栋;姜孝馨;金好庆;李镐式 | 申请(专利权)人: | 三星电子株式会社 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L25/30 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 方成;张川绪 |
地址: | 韩国京畿*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 设备 | ||
1.一种训练模型的方法,所述方法包括:
针对输入序列,获取教师模型的识别结果和学生模型的识别结果;并且
训练学生模型,使得教师模型的识别结果和学生模型的识别结果彼此无法被区分。
2.根据权利要求1所述的方法,其中,训练学生模型的步骤包括:
基于教师模型的识别结果和学生模型的识别结果彼此被区分的程度,确定对抗损失;并且
训练学生模型以减小对抗损失。
3.根据权利要求2所述的方法,其中,确定对抗损失的步骤包括:
基于针对输入序列分别被输出作为识别结果的教师模型的输出序列和学生模型的输出序列彼此被区分的程度,确定对抗损失。
4.根据权利要求3所述的方法,其中,确定对抗损失的步骤包括:
通过基于包括在输出序列中的元素的概率应用Gumbel-max,确定对抗损失。
5.根据权利要求3所述的方法,其中,确定对抗损失的步骤包括:
通过基于输出序列的概率应用Gumbel-max,确定对抗损失。
6.根据权利要求5所述的方法,其中,确定对抗损失的步骤包括:
通过基于可能对应于输出序列的多个候选序列的概率进一步应用Gumbel-max,确定对抗损失。
7.根据权利要求2所述的方法,其中,确定对抗损失的步骤包括:
基于针对输入序列分别被输出作为识别结果的教师模型的输出序列中的元素和学生模型的输出序列中的元素彼此被区分的程度,确定对抗损失。
8.根据权利要求7所述的方法,其中,确定对抗损失的步骤包括:
通过基于包括在输出序列中的元素的概率应用Gumbel-max,确定对抗损失。
9.根据权利要求1所述的方法,其中,训练学生模型的步骤包括:
训练学生模型,使得教师模型的识别结果和学生模型的识别结果无法通过判别器模型被区分彼此,并且
判别器模型被训练为在教师模型的识别结果与学生模型的识别结果之间进行区分。
10.根据权利要求1所述的方法,其中,训练学生模型的步骤包括:
使用教师模型的识别结果训练学生模型,使得教师模型的识别结果从学生模型输出。
11.根据权利要求1所述的方法,其中,输入序列包括:
包括词的句数据和包括帧的语音数据。
12.一种存储指令的非暂时性计算机可读存储介质,所述指令当由处理器执行时,使得处理器执行权利要求1所述的方法。
13.一种用于训练模型的设备,所述设备包括:
处理器,被配置为:针对输入序列,获取教师模型的识别结果和学生模型的识别结果;并且训练学生模型,使得教师模型的识别结果和学生模型的识别结果彼此无法被区分。
14.根据权利要求13所述的设备,其中,处理器还被配置为:基于教师模型的识别结果和学生模型的识别结果彼此被区分的程度,确定对抗损失;并且训练学生模型以减小对抗损失。
15.根据权利要求14所述的设备,其中,处理器还被配置为:基于针对输入序列分别被输出作为识别结果的教师模型的输出序列和学生模型的输出序列彼此被区分的程度,确定对抗损失。
16.根据权利要求15所述的设备,其中,处理器还被配置为:通过基于包括在输出序列中的元素的概率应用Gumbel-max,确定对抗损失。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911326890.4/1.html,转载请声明来源钻瓜专利网。