[发明专利]一种基于深度学习的小尺度单元拼接语音合成算法及系统在审
申请号: | 202010649231.0 | 申请日: | 2020-07-08 |
公开(公告)号: | CN111754975A | 公开(公告)日: | 2020-10-09 |
发明(设计)人: | 汪金玲 | 申请(专利权)人: | 汪金玲 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L13/04;G10L13/08;G10L25/03;G10L25/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 410000 湖南省长沙市*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 尺度 单元 拼接 语音 合成 算法 系统 | ||
本发明涉及一种语音合成的技术领域,揭露了一种基于深度学习的小尺度单元拼接语音合成算法,包括:获取语音合成训练集,并利用自适应加权谱模型提取训练集中语音信号的特征;利用基于波形内插的方法,提取语音信号特征中的特征波形;利用预训练的DNN模型接收用于语音合成的文本信息,并结合目标代价和连接代价选取对应文本信息的特征波形;将所述特征波形与STRAIGHT合成器依据预测的基频特征生成的激励波形进行频域拼接处理,得到合成的语音结果。本发明还提出一种基于深度学习的小尺度单元拼接语音合成系统。本发明实现了语音的合成。
技术领域
本发明涉及语音合成的技术领域,尤其涉及一种基于深度学习的小尺度 单元拼接语音合成算法及系统。
背景技术
近年来,随着移动互联网的兴起和智能手机等移动终端的普日益及,基 于语音识别、自然语言理解和语音合成的人机语音交互技术受到广泛关注并 发展迅速。语音交互方式被认为是最自然、最具前景的人机交互方式,语音 合成技术作为核心之一,也取得了显著的进步。合成的语音在自然度、可懂 度和音质上都有明显改善,在日常生活中应用也比较多,如地图导航、新闻 朗读和手机语音助手等。
传统的语音合成技术有两种比较主流的实现方法,一种是基于HMM的统 计参数合成方法,该方法具有系统尺寸小,计算复杂度低等优势。但合成的 语音和自然语音相比有较大的差距,一般在离线系统中使用。另一种是基于 大语料库的单元挑选与波形拼接合成方法,该方法使用自然语音拼接而成, 合成的语音自然度较好。这类方法因为音库尺寸大,往往部署在云端,移动 设备通过互联网发送请求并接收合成语音,所以需要花费数据流量。
同时随着计算机存储能力的增加,音库尺寸不断增加,基于大语料库的 单元挑选与波形拼接合成方法的使用也越来越广泛。该方法的优势在于保留 了原始语音的音质,在自然度上相对于参数合成方法有了极大的提高。但是 该方法也存在一些缺点和不足,比如合成效果不稳定,单元拼接处存在不连 续现象。为了保证合成效果,需要满足一定的单元覆盖率,传统的基于音素 或者更长尺度单元的拼接合成系统,要求音库的尺寸很大。这导致音库制作 需要花费很大的工作量,增加系统设计的时间和成本。如果音库的尺寸较小,则无法保证单元的覆盖率,合成效果很不稳定,合成语音的音质大大下降。
鉴于此,如何提升合成语音的自然度,成为本领域技术人员亟待解决的 问题。
发明内容
本发明提供一种基于深度学习的小尺度单元拼接语音合成算法,利用自 适应加权谱模型提取训练集中语音信号的特征,并利用基于波形内插的方法, 提取语音信号特征中的特征波形,根据所提取的特征波形,利用预训练的DNN 模型接收用于语音合成的文本信息,并结合目标代价和连接代价选取对应文 本信息的特征波形,同时将所述特征波形与STRAIGHT合成器依据预测的基 频特征生成的激励波形进行了频域拼接处理,实现了语音的合成。
为实现上述目的,本发明提供的一种基于深度学习的小尺度单元拼接语 音合成算法,包括:
获取语音合成训练集,并利用自适应加权谱模型提取训练集中语音信号 的特征;
利用基于波形内插的方法,提取语音信号特征中的特征波形;
利用预训练的DNN模型接收用于语音合成的文本信息,并结合目标代价 和连接代价选取对应文本信息的特征波形;
将所述特征波形与STRAIGHT合成器依据预测的基频特征生成的激励波 形进行频域拼接处理,得到合成的语音结果。
可选地,所述利用自适应加权谱模型提取训练集中语音信号的特征,包 括:
1)利用下式对训练集中语音信号进行短时傅里叶变换处理:
F(ω,t)=FFT[x(t)w(t)]
x(t)=v(t)*e(t)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汪金玲,未经汪金玲许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010649231.0/2.html,转载请声明来源钻瓜专利网。