[发明专利]一种基于深度学习的小尺度单元拼接语音合成算法及系统在审

专利信息
申请号: 202010649231.0 申请日: 2020-07-08
公开(公告)号: CN111754975A 公开(公告)日: 2020-10-09
发明(设计)人: 汪金玲 申请(专利权)人: 汪金玲
主分类号: G10L13/02 分类号: G10L13/02;G10L13/04;G10L13/08;G10L25/03;G10L25/30
代理公司: 暂无信息 代理人: 暂无信息
地址: 410000 湖南省长沙市*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 深度 学习 尺度 单元 拼接 语音 合成 算法 系统
【说明书】:

发明涉及一种语音合成的技术领域,揭露了一种基于深度学习的小尺度单元拼接语音合成算法,包括:获取语音合成训练集,并利用自适应加权谱模型提取训练集中语音信号的特征;利用基于波形内插的方法,提取语音信号特征中的特征波形;利用预训练的DNN模型接收用于语音合成的文本信息,并结合目标代价和连接代价选取对应文本信息的特征波形;将所述特征波形与STRAIGHT合成器依据预测的基频特征生成的激励波形进行频域拼接处理,得到合成的语音结果。本发明还提出一种基于深度学习的小尺度单元拼接语音合成系统。本发明实现了语音的合成。

技术领域

本发明涉及语音合成的技术领域,尤其涉及一种基于深度学习的小尺度 单元拼接语音合成算法及系统。

背景技术

近年来,随着移动互联网的兴起和智能手机等移动终端的普日益及,基 于语音识别、自然语言理解和语音合成的人机语音交互技术受到广泛关注并 发展迅速。语音交互方式被认为是最自然、最具前景的人机交互方式,语音 合成技术作为核心之一,也取得了显著的进步。合成的语音在自然度、可懂 度和音质上都有明显改善,在日常生活中应用也比较多,如地图导航、新闻 朗读和手机语音助手等。

传统的语音合成技术有两种比较主流的实现方法,一种是基于HMM的统 计参数合成方法,该方法具有系统尺寸小,计算复杂度低等优势。但合成的 语音和自然语音相比有较大的差距,一般在离线系统中使用。另一种是基于 大语料库的单元挑选与波形拼接合成方法,该方法使用自然语音拼接而成, 合成的语音自然度较好。这类方法因为音库尺寸大,往往部署在云端,移动 设备通过互联网发送请求并接收合成语音,所以需要花费数据流量。

同时随着计算机存储能力的增加,音库尺寸不断增加,基于大语料库的 单元挑选与波形拼接合成方法的使用也越来越广泛。该方法的优势在于保留 了原始语音的音质,在自然度上相对于参数合成方法有了极大的提高。但是 该方法也存在一些缺点和不足,比如合成效果不稳定,单元拼接处存在不连 续现象。为了保证合成效果,需要满足一定的单元覆盖率,传统的基于音素 或者更长尺度单元的拼接合成系统,要求音库的尺寸很大。这导致音库制作 需要花费很大的工作量,增加系统设计的时间和成本。如果音库的尺寸较小,则无法保证单元的覆盖率,合成效果很不稳定,合成语音的音质大大下降。

鉴于此,如何提升合成语音的自然度,成为本领域技术人员亟待解决的 问题。

发明内容

本发明提供一种基于深度学习的小尺度单元拼接语音合成算法,利用自 适应加权谱模型提取训练集中语音信号的特征,并利用基于波形内插的方法, 提取语音信号特征中的特征波形,根据所提取的特征波形,利用预训练的DNN 模型接收用于语音合成的文本信息,并结合目标代价和连接代价选取对应文 本信息的特征波形,同时将所述特征波形与STRAIGHT合成器依据预测的基 频特征生成的激励波形进行了频域拼接处理,实现了语音的合成。

为实现上述目的,本发明提供的一种基于深度学习的小尺度单元拼接语 音合成算法,包括:

获取语音合成训练集,并利用自适应加权谱模型提取训练集中语音信号 的特征;

利用基于波形内插的方法,提取语音信号特征中的特征波形;

利用预训练的DNN模型接收用于语音合成的文本信息,并结合目标代价 和连接代价选取对应文本信息的特征波形;

将所述特征波形与STRAIGHT合成器依据预测的基频特征生成的激励波 形进行频域拼接处理,得到合成的语音结果。

可选地,所述利用自适应加权谱模型提取训练集中语音信号的特征,包 括:

1)利用下式对训练集中语音信号进行短时傅里叶变换处理:

F(ω,t)=FFT[x(t)w(t)]

x(t)=v(t)*e(t)

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汪金玲,未经汪金玲许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010649231.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top