[发明专利]语音处理方法、装置及网络设备在审
| 申请号: | 202210453468.0 | 申请日: | 2022-04-27 |
| 公开(公告)号: | CN114999506A | 公开(公告)日: | 2022-09-02 |
| 发明(设计)人: | 陈海涛;郭凯旋;甘文东;文博龙;闫影;李建伟;李海 | 申请(专利权)人: | 成都爱奇艺智能创新科技有限公司 |
| 主分类号: | G10L21/013 | 分类号: | G10L21/013 |
| 代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 吕俊秀 |
| 地址: | 610096 四川省成都市中国(四川)*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 处理 方法 装置 网络设备 | ||
本发明实施例提供了一种语音处理方法、装置及网络设备,该方法包括:获取待处理语音;对所述待处理语音进行切割,得到至少两个第一语音片段,每两个相邻的第一语音片段之间具有部分重叠语音片段;对所述至少两个第一语音片段采用多线程并行处理方式进行语音转换处理,得到至少两个语音转换结果;所述至少两个第一语音片段对应源音色,所述至少两个语音转换结果对应目标音色;将所述至少两个语音转换结果进行语音拼接处理,得到语音输出结果。通过上述方案,可以防止音色转换过程中的语音失真情况的发生,还可以加速语音处理速度。
技术领域
本发明涉及计算机技术领域,特别是涉及一种语音处理方法、装置及网络设备。
背景技术
移动互联网时代是短视频+直播时代,比如电商直播或内容直播,是最具潜力的流量变现手段。在这种环境下,声音的意义更加凸显,传统变声器已非常普及,在直播、游戏、在线社交等场景运用广泛。
AI实时变声系统,除了效果碾压传统变声器外,还可以实现很多传统变声器不可能实现的功能,比如:克隆音色,变成任意想要变成的人的声音,以及普通话转为方言等,赋能直播,游戏以及所有在线社交场景。
语音转换(Voice Conversion,VC)或变声是指通过改变与源说话人的个性特征有关的声学特征参数,使声音听起来像是目标说话人的语音,而语义是不发生变化的。语音转换的方法,一般可以分为2大类,一类是平行语料,另一类是非平行语料。平行语料对训练数据的要求很严格,而且只能转换训练集内的人的音色,因此目前广泛使用的是非平行语料方法,即VC模型使用的方法,现有方法通过VC模型进行语音转换会导致语音转换结果失真的问题,并且语音转换时间较长,效率较低。
发明内容
本发明实施例的目的在于提供一种语音处理方法、装置及网络设备,以在一定程度上解决现有技术进行语音转换不仅转换时间较长,而且会导致语音转换结果失真的问题。具体技术方案如下:
在本发明实施的第一方面,首先提供了一种流程处理方法,包括:
获取待处理语音;
对所述待处理语音进行切割,得到至少两个第一语音片段,每两个相邻的第一语音片段之间具有部分重叠语音片段;
对所述至少两个第一语音片段采用多线程并行处理方式进行语音转换处理,得到至少两个语音转换结果;所述至少两个第一语音片段对应源音色,所述至少两个语音转换结果对应目标音色;
将所述至少两个语音转换结果进行语音拼接处理,得到语音输出结果。
可选的,针对每个第一语音片段,对所述第一语音片段进行语音转换处理,得到语音转换结果的过程,包括:
将所述第一语音片段输入至语音识别模型中进行语音识别处理,得到语音后验概率PPG特征;
将所述语音后验概率PPG特征和目标音色标识ID输入至语音转换模型中进行语音转换处理,得到语音转换结果。
可选的,所述多线程并行处理方式,包括:
在所述至少两个第一语音片段中的第i个第一语音片段进行语音转换处理的过程中,同时进行所述至少两个第一语音片段中的第i+1个第一语音片段的语音识别处理,i为正整数。
可选的,在所述至少两个第一语音片段包括:第二语音片段和第三语音片段的情况下,所述将所述至少两个语音转换结果进行语音拼接处理,得到语音输出结果,包括:;
获取所述第二语音片段和所述第三语音片段的重叠语音片段的任意时刻与所述重叠语音片段的中间时刻的时间差;
根据所述时间差与预设调节系数,计算所述第二语音片段在所述任意时刻的第一拼接系数,以及所述第三语音片段在所述任意时刻的第二拼接系数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都爱奇艺智能创新科技有限公司,未经成都爱奇艺智能创新科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210453468.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种无线通讯设备
- 下一篇:一种质子交换膜及其制备方法





