[发明专利]语音分离网络生成方法、装置、电子设备以及存储介质在审
申请号: | 202210975124.6 | 申请日: | 2022-08-15 |
公开(公告)号: | CN115331694A | 公开(公告)日: | 2022-11-11 |
发明(设计)人: | 姚鹏;王洋;李晨星;谈建超;邓峰;王晓瑞;宋成儒 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G10L21/0272 | 分类号: | G10L21/0272;G10L25/30;G10L19/16;G10L19/02 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 李加欣 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 分离 网络 生成 方法 装置 电子设备 以及 存储 介质 | ||
本公开关于一种语音分离网络生成方法、装置、电子设备以及存储介质,属于语音处理技术领域,该方法包括:在给定多个样本音频信号的基础上,迭代训练获取到的语音分离超网络,其中,该语音分离超网络包括编码器和解码器,编码器和解码器均包括多个网络层和搜索空间,该搜索空间配置有多个网络层的结构参数。进一步地,基于训练后的语音分离超网络,生成符合目标条件的目标语音分离子网络。在上述过程中,通过设计一种配置有结构参数的搜索空间,实现了基于语音分离超网络,自动生成符合目标条件的目标语音分离子网络,避免了手动调节网络中不同网络层的结构参数,提高了语音分离网络的生成效率。
技术领域
本公开涉及语音处理技术领域,尤其涉及一种语音分离网络生成方法、装置、电子设备以及存储介质。
背景技术
语音分离技术作为一种能够将来自不同声源的混合音频信号进行分离的语音处理技术,在语音识别、音乐信息检索以及关键字定位等方面起到十分重要的作用。
相关技术中,往往基于收集到的样本音频信号,对人工设计的语音分离网络进行训练,得到训练好的语音分离网络,以实现语音分离功能。
然而,人工设计语音分离网络时,往往需要手动调节网络中不同网络层的结构参数,这一过程依赖于开发人员的专业知识和大量的实验资源,导致语音分离网络的生成过程耗时耗力且效率低下。
发明内容
本公开提供一种语音分离网络生成方法、装置、电子设备以及存储介质,能够提高语音分离网络的生成效率。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种语音分离网络生成方法,该方法包括:
获取语音分离超网络,该语音分离超网络包括编码器和解码器,该编码器和该解码器均包括多个网络层和搜索空间,该搜索空间配置有该多个网络层的结构参数,该结构参数包括下述至少一项:网络层的个数、网络层的多头自注意力机制模块中自注意力头的个数、网络层的前向感知模块中隐藏层的神经元个数;
基于多个样本音频信号,迭代训练该语音分离超网络,其中,在第i次迭代过程中,基于该编码器和该解码器对应的搜索空间,确定该语音分离超网络在本次迭代过程中的多个语音分离子网络,该多个语音分离子网络的结构参数是基于多种不同的结构参数组合方式从该编码器和该解码器对应的搜索空间中确定的,基于该多个语音分离子网络和本次迭代过程中输入的样本音频信号,获取本次迭代过程中输入的样本音频信号的语音分离结果,基于该语音分离结果和标注音频信号,确定该语音分离超网络的损失值,基于该损失值,更新该语音分离超网络的网络参数,i为正整数;
基于训练后的该语音分离超网络,生成符合目标条件的目标语音分离子网络。
通过上述方法,在给定多个样本音频信号的基础上,迭代训练获取到的语音分离超网络,其中,该语音分离超网络包括编码器和解码器,编码器和解码器均包括多个网络层和搜索空间,该搜索空间配置有多个网络层的结构参数。进一步地,基于训练后的该语音分离超网络,生成符合目标条件的目标语音分离子网络。在上述过程中,通过设计一种配置有结构参数的搜索空间,实现了基于语音分离超网络,自动生成符合目标条件的目标语音分离子网络,避免了手动调节网络中不同网络层的结构参数,提高了语音分离网络的生成效率,实现了网络轻量化和泛化性的平衡。
在一些实施例中,该方法还包括:
从该多个样本音频信号中确定多组样本音频信号,每组样本音频信号包括至少一个样本音频信号;
该基于该多个语音分离子网络和本次迭代过程中输入的样本音频信号,获取本次迭代过程中输入的样本音频信号的语音分离结果,包括:
将各组样本音频信号按照各个语音分离子网络对应的传播路径在该语音分离超网络中进行前向传播,得到各组样本音频信号的语音分离结果,其中,一组样本音频信号对应一个语音分离子网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210975124.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种显示装置及交通工具
- 下一篇:与结直肠癌化疗药物耐药相关的靶点及应用