[发明专利]多频带同步神经声码器在审
| 申请号: | 202080038265.4 | 申请日: | 2020-08-12 |
| 公开(公告)号: | CN113874933A | 公开(公告)日: | 2021-12-31 |
| 发明(设计)人: | 俞承柱;于蒙;卢恒;俞栋 | 申请(专利权)人: | 腾讯美国有限责任公司 |
| 主分类号: | G10L13/04 | 分类号: | G10L13/04;G10L13/047;G10L13/033 |
| 代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 陈世华;王琦 |
| 地址: | 美国加利福尼亚州*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 频带 同步 神经 声码 | ||
1.一种由多频带同步神经声码器执行的方法,其特征在于,包括:
接收将由所述多频带同步神经声码器进行处理的输入音频信号;
由所述多频带同步神经声码器,将所述输入音频信号分离成多个频带;
基于将所述输入音频信号分离成所述多个频带,由所述多频带同步神经声码器,获取与所述多个频带对应的多个音频信号;
基于获取所述多个音频信号,由所述多频带同步神经声码器,对所述多个音频信号中的每个音频信号进行下采样;
由所述多频带同步神经声码器,处理下采样的音频信号;及,
由所述多频带同步神经声码器,基于处理下采样的音频信号,生成音频输出信号。
2.根据权利要求1所述的方法,其特征在于,同时处理所述多个频带中每个频带的下采样的音频信号。
3.根据权利要求1所述的方法,其特征在于,使用单个处理单元,处理所述多个频带中每个频带的下采样的音频信号。
4.根据权利要求1所述的方法,其特征在于,所述神经声码器为WaveNet声码器。
5.根据权利要求1所述的方法,其特征在于,所述神经声码器为WaveRNN声码器。
6.根据权利要求1所述的方法,其特征在于,所述神经声码器为LPCNet声码器。
7.根据权利要求1所述的方法,其特征在于,进一步包括:
对每个处理后的音频信号进行上采样;
基于每个上采样后的处理后的音频信号,生成所述音频输出信号。
8.一种多频带同步神经声码器设备,其特征在于,包括:
至少一个存储器,用于存储计算机程序代码;
至少一个处理器,用于读取所述计算机程序代码,根据所述计算机程序代码的指令进行操作,所述程计算机序代码包括:
接收代码,用于使得所述至少一个处理器,接收将由所述多频带同步神经声码器进行处理的输入音频信号;
分离代码,用于使得所述至少一个处理器,由所述多频带同步神经声码器,将所述输入音频信号分离成多个频带;
获取代码,用于使得所述至少一个处理器,基于将所述输入音频信号分离成所述多个频带,由所述多频带同步神经声码器,获取与所述多个频带对应的多个音频信号;
下采样代码,用于使得所述至少一个处理器,基于获取所述多个音频信号,由所述多频带同步神经声码器,对所述多个音频信号中的每个音频信号进行下采样;
处理代码,用于使得所述至少一个处理器,由所述多频带同步神经声码器,处理下采样的音频信号;及,
生成代码,用于使得所述至少一个处理器,由所述多频带同步神经声码器,基于处理下采样的音频信号,生成音频输出信号。
9.根据权利要求8所述的设备,其特征在于,同时处理所述多个频带中每个频带的下采样的音频信号。
10.根据权利要求8所述的设备,其特征在于,使用单个处理单元,处理所述多个频带中每个频带的下采样的音频信号。
11.根据权利要求8所述的设备,其特征在于,所述神经声码器为WaveNet声码器。
12.根据权利要求8所述的设备,其特征在于,所述神经声码器为WaveRNN声码器。
13.根据权利要求8所述的设备,其特征在于,所述神经声码器为LPCNet声码器。
14.根据权利要求8所述的设备,其特征在于,进一步包括:
上采样代码,用于使得所述至少一个处理器,对每个处理后的音频信号进行上采样;
其中,所述生成代码进一步用于使得所述至少一个处理器,基于每个上采样后的处理后的音频信号,生成所述音频输出信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯美国有限责任公司,未经腾讯美国有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080038265.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:二次电池
- 下一篇:剪叉式升降机载荷感测系统和方法





