[发明专利]音频事件检测模型训练方法及装置在审
申请号: | 202111005905.4 | 申请日: | 2021-08-30 |
公开(公告)号: | CN113724740A | 公开(公告)日: | 2021-11-30 |
发明(设计)人: | 张鹏远;刘钰卓;颜永红 | 申请(专利权)人: | 中国科学院声学研究所 |
主分类号: | G10L25/78 | 分类号: | G10L25/78;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈霁 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 事件 检测 模型 训练 方法 装置 | ||
本发明涉及音频检测技术领域,提供了一种音频事件检测模型训练方法及装置,方法包括:对大师模型、教师模型、学生模型进行多次迭代,将满足迭代结束条件的学生模型作为音频事件检测模型;其中,在每次迭代中,对大师和教师模型的输出动态校正,为无标注数据生成伪标签;利用音频事件标签、大师模型的输出、老师模型的输出,迭代教师模型;根据教师模型参数更新大师模型的参数;用音频事件标签和伪标签迭代学生模型。本实施例的技术方案,通过大师模型和教师模型的模型参数的循环提升以及大师模型的输出对教师模型的输出的动态校正,可以提高无标注样本的利用效率,提升伪标签的正确率,从而提升音频事件检测的准确性。
技术领域
本发明涉及音频检测技术领域,尤其涉及音频事件检测模型训练方法及装置。
背景技术
音频事件检测是从一段连续音频中检测出是否有某种音频事件发生。
目前,通过标注样本进行教师模型训练,使用训练好的教师模型获取无标注样本的标签,通过无标注样本的标签进行学生模型的训练,使用训练好的学生模型进行音频事件检测。
但是,标注样本往往获取困难且花费高昂,在标注样本数量较少的情况下训练好的模型的模型精度可能较低,从而导致音频事件检测的准确性较低。
发明内容
本实施例提供了一种音频事件检测模型训练方法、装置、计算机可读存储介质及电子设备,通过大师模型和教师模型的模型参数的循环提升以及大师模型的输出对教师模型的输出的动态校正,可以提高无标注样本的利用效率,提升伪标签的正确率,从而提升音频事件检测的准确性。
第一方面,本实施例提供了一种音频事件检测模型训练方法,包括:
对于用于音频事件检测的多个训练样本中的每个训练样本,确定训练样本的三个训练特征;其中,所述训练样本为无标注样本或标注有音频事件标签的标注样本;所述三个训练特征均为所述训练样本的声学特征;所述多个训练样本划分为K个训练样本集,所述K个训练样本集各集均包括所述无标注样本和所述标注样本,所述K为大于等于1的正整数;
对大师模型、教师模型、学生模型进行多次迭代,基于满足迭代结束条件的学生模型作为音频事件检测模型进行音频事件检测;其中,大师模型和教师模型的模型结构相同;多次迭代包括M个训练周期,M个训练周期各周期均包括分别与K个训练样本集一一对应的K次迭代,K次迭代中每次迭代对应的训练样本集中训练样本的三个训练特征分别作为大师模型、教师模型、学生模型的输入;多次迭代中的每次迭代包括:
根据大师模型基于上次迭代的模型参数对本次迭代输入的无标注样本的训练特征进行计算输出的音频事件概率,对教师模型基于上次迭代的模型参数对本次迭代输入的无标注样本的训练特征进行计算输出的音频事件概率进行修正,确定本次迭代对应的无标注样本的伪标签;
根据学生模型基于上次迭代的模型参数对本次迭代输入的训练特征进行计算输出的音频事件概率、本次迭代对应的标注样本的音频事件标签、本次迭代对应的无标注样本的伪标签,调整学生模型上次迭代的模型参数,确定学生模型本次迭代的模型参数;
根据大师模型和教师模型各自基于上次迭代的模型参数对本次迭代输入的训练特征进行计算输出的音频事件概率、本次迭代对应的标注样本的音频事件标签,调整教师模型上次迭代的模型参数,确定教师模型本次迭代的模型参数;
基于教师模型本次迭代和之前迭代的模型参数,确定大师模型本次迭代的模型参数。
第二方面,本实施例提供了一种音频事件检测模型训练装置,包括:
对于用于音频事件检测的多个训练样本中的每个训练样本,确定训练样本的三个训练特征;其中,所述训练样本为无标注样本或标注有音频事件标签的标注样本;所述三个训练特征均为所述训练样本的声学特征;所述多个训练样本划分为K个训练样本集,所述K个训练样本集各集均包括所述无标注样本和所述标注样本,所述K为大于等于1的正整数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所,未经中国科学院声学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111005905.4/2.html,转载请声明来源钻瓜专利网。