[发明专利]一种合成歌声音频的方法以及装置有效
申请号: | 202011013513.8 | 申请日: | 2020-09-24 |
公开(公告)号: | CN112185343B | 公开(公告)日: | 2022-07-22 |
发明(设计)人: | 卢迪 | 申请(专利权)人: | 长春迪声软件有限公司 |
主分类号: | G10L13/04 | 分类号: | G10L13/04;G10L13/047;G10L13/08 |
代理公司: | 北京轻创知识产权代理有限公司 11212 | 代理人: | 刘宇波 |
地址: | 130000 吉林省长春*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 合成 歌声 音频 方法 以及 装置 | ||
本公开是关于一种合成歌声音频的方法以及装置,属于音频处理领域。所述方法包括:获取预存的平均歌声模型;获取目标歌声数据的目标特征值文本以及目标声学参数;根据所述目标特征值文本以及所述目标声学参数,确定所述目标发音人的特征值文本与声学参数的特征对应表;基于所述目标特征值文本以及所述目标声学参数,对所述平均歌声模型进行训练,得到目标歌声模型;当接收到待合成曲谱时,提取所述待合成曲谱的特征值文本,基于所述待合成曲谱的特征值文本、所述目标歌声模型以及所述特征对应表,得到所述待合成曲谱对应的目标歌声音频。采用本公开,可以提高歌声合成的效率。
技术领域
本公开涉及音频处理领域,尤其涉及一种合成歌声音频的方法以及装置。
背景技术
随着音频技术的发展,歌声合成技术也随着越见成熟。歌声合成的目的是让计算机像人类一样唱歌,是一种计算机与音乐艺术的交叉学科问题。目前,基于合成的质量以及多样性考虑,传统的歌声合成的方式通常是采用样本对歌声合成模型进行训练,歌声合成模型可以是HMM(Hidden Markov Model,隐含马尔柯夫模型)等,使用歌声合成模型前,需要对歌声合成模型进行训练,为了达到歌声合成模型的准确率,需要准备大量的样本对初始模型进行训练,训练的过程计算量巨大,耗时较长,导致训练效率较低,进而使得歌声合成的效率较低。
发明内容
本公开提供一种合成歌声音频的方法以及装置,可以解决歌声合成效率低的问题。
根据本公开实施例的第一方面,提供一种合成歌声音频的方法,包括:
获取预存的平均歌声模型;
获取目标歌声数据的目标特征值文本以及目标声学参数;
根据所述目标特征值文本以及所述目标声学参数,确定所述目标发音人的特征值文本与声学参数的特征对应表;
基于所述目标特征值文本以及所述目标声学参数,对所述平均歌声模型进行训练,得到目标歌声模型;
当接收到待合成曲谱时,提取所述待合成曲谱的特征值文本,基于所述待合成曲谱的特征值文本、所述目标歌声模型以及所述特征对应表,得到所述待合成曲谱对应的目标歌声音频。
可选地,所述获取预存的平均歌声模型,包括:
获取多个样本发音人的样本歌声数据;
提取所述样本歌声数据的样本特征值文本以及样本声学参数;
基于所述样本特征值文本以及所述样本声学参数,对初始歌声模型进行训练,得到平均歌声模型。
可选地,所述根据所述目标特征值文本以及所述目标声学参数,确定所述目标发音人的特征值文本与声学参数的特征对应表,包括:
截取所述目标歌声数据的每个子音以及每个母音对应的声学参数,将每个子音以及每个母音对应的声学参数的对应关系确定为所述目标发音人的特征值文本与声学参数的特征对应表。
可选地,所述基于所述目标特征值文本以及所述目标声学参数,对所述平均歌声模型进行训练,得到目标歌声模型,包括:
将所述目标特征值文本输入所述平均歌声模型,得到输出的预测声学参数;
基于所述预测声学参数与所述目标声学参数的对比,对所述平均歌声模型内的模型参数进行调整,直到所述预测声学参数与所述目标声学参数的误差值小于或等于预设误差值为止,将最后一次调整后的模型参数确定为目标歌声模型的模型参数,得到目标歌声模型。
可选地,所述待合成曲谱的特征值文本包括子音音符对应的特征值文本、母音音符对应的特征值文本以及过渡音符对应的特征值文本,
所述基于所述待合成曲谱的特征值文本、所述目标歌声模型以及所述特征对应表,得到所述待合成曲谱对应的目标歌声音频,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长春迪声软件有限公司,未经长春迪声软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011013513.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种林木加工废料收集装置
- 下一篇:一种基于万向移动调节螺钉螺座的固定组件