[发明专利]文本到语音的转换方法、装置和计算机设备有效
| 申请号: | 201810241804.9 | 申请日: | 2018-03-22 |
| 公开(公告)号: | CN108492818B | 公开(公告)日: | 2020-10-30 |
| 发明(设计)人: | 张黄斌 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
| 主分类号: | G10L13/10 | 分类号: | G10L13/10;G10L13/04;G10L25/30 |
| 代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文本 语音 转换 方法 装置 计算机 设备 | ||
1.一种文本到语音的转换方法,其特征在于,包括:
获取待转换文本对应的帧;
获取所述帧中当前帧对应音子的向量特征和文本韵律特征,以及获取所述当前帧的上一帧对应的线性谱的映射特征;
将获取的向量特征、文本韵律特征和映射特征输入预先训练的神经网络模型,获得所述当前帧对应的线性谱;
在获得所述待转换文本对应的帧的线性谱之后,根据所述待转换文本对应的帧的线性谱,获得所述待转换文本对应的语音;
所述获取所述当前帧的上一帧对应的线性谱的映射特征包括:
将所述当前帧的上一帧对应的线性谱输入由两层全连接层组成的神经网络进行映射,获得所述当前帧的上一帧对应的线性谱的映射特征。
2.根据权利要求1所述的方法,其特征在于,所述根据所述待转换文本对应的帧的线性谱,获得所述待转换文本对应的语音包括:
从所述待转换文本对应的帧的线性谱中通过迭代获得所述待转换文本对应的语音的相位谱;
根据所述待转换文本对应的语音的相位谱,通过反向短时傅里叶变换算法生成所述待转换文本对应的语音。
3.根据权利要求1所述的方法,其特征在于,所述将获取的向量特征、文本韵律特征和映射特征输入预先训练的神经网络模型,获得所述当前帧对应的线性谱包括:
将获取的向量特征、文本韵律特征和映射特征经过一层全连接层进行降维后,输入由至少两个存在残差连接的卷积单元组成的网络中,经过一层全连接层进行升采样后,获得所述当前帧对应的线性谱。
4.根据权利要求3所述的方法,其特征在于,所述卷积单元包括两个一维卷积核,其中一个卷积核的输出通过激活函数规整到预定区间上;所述卷积单元的输出为一个卷积核规整到预定区间上的输出结果与另一个卷积核未通过激活函数的输出结果的对应元素的乘积。
5.根据权利要求1-4任意一项所述的方法,其特征在于,所述将获取的向量特征、文本韵律特征和映射特征输入预先训练的神经网络模型,获得所述当前帧对应的线性谱之前,还包括:
获取训练文本对应的帧;
获取所述训练文本对应的帧中当前帧对应音子的向量特征和文本韵律特征,以及获取所述训练文本对应的语音中所述当前帧的上一帧语音对应的线性谱的映射特征;
将获取的向量特征、文本韵律特征和映射特征输入待训练的神经网络模型,获得所述当前帧对应的线性谱;
在获得所述训练文本对应的帧的线性谱之后,根据所述训练文本对应的帧的线性谱,获得所述训练文本对应的语音;
当获得的所述训练文本对应的语音满足预定条件时,获得训练好的神经网络模型。
6.一种文本到语音的转换装置,其特征在于,包括:
获取模块,用于获取待转换文本对应的帧;获取所述帧中当前帧对应音子的向量特征和文本韵律特征,以及获取所述当前帧的上一帧对应的线性谱的映射特征;
输入模块,用于将所述获取模块获取的向量特征、文本韵律特征和映射特征输入预先训练的神经网络模型,获得所述当前帧对应的线性谱;
转换模块,用于在获得所述待转换文本对应的帧的线性谱之后,根据所述待转换文本对应的帧的线性谱,获得所述待转换文本对应的语音;
所述获取模块,具体用于将所述当前帧的上一帧对应的线性谱输入由两层全连接层组成的神经网络进行映射,获得所述当前帧的上一帧对应的线性谱的映射特征。
7.根据权利要求6所述的装置,其特征在于,
所述转换模块,具体用于从所述待转换文本对应的帧的线性谱中通过迭代获得所述待转换文本对应的语音的相位谱;根据所述待转换文本对应的语音的相位谱,通过反向短时傅里叶变换算法生成所述待转换文本对应的语音。
8.根据权利要求6所述的装置,其特征在于,
所述输入模块,具体用于将获取的向量特征、文本韵律特征和映射特征经过一层全连接层进行降维后,输入由至少两个存在残差连接的卷积单元组成的网络中,经过一层全连接层进行升采样后,获得所述当前帧对应的线性谱。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810241804.9/1.html,转载请声明来源钻瓜专利网。





