[发明专利]一种模拟用户说话的语音合成方法及系统在审
申请号: | 201711080690.6 | 申请日: | 2017-11-06 |
公开(公告)号: | CN107833572A | 公开(公告)日: | 2018-03-23 |
发明(设计)人: | 孟猛 | 申请(专利权)人: | 芋头科技(杭州)有限公司 |
主分类号: | G10L13/08 | 分类号: | G10L13/08;G10L13/033;G10L13/04;G10L15/26;G10L15/02 |
代理公司: | 上海申新律师事务所31272 | 代理人: | 党蕾 |
地址: | 310000 浙江省杭州市余杭区*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种模拟用户说话的语音合成方法及系统,属于语音合成技术领域;方法包括步骤S1,获取外部输入的一段待模拟语音;步骤S2,将待模拟语音识别为对应的包括多个顺序排列的基本音子的发音文本;步骤S3,根据待模拟语音分别处理得到发音文本中每个基本音子的发音时段信息;步骤S4,将发音文本和发音时段信息送入包括一预先训练形成的语音合成模型的语音合成器中,以得到对应于待模拟语音的合成语音并输出。系统包括语音获取单元、语音识别单元、处理单元以及合成单元。上述技术方案的有益效果是体现语音模拟应用的音色一致性,突出应用本身的个性特点,同时提供给用户更有特色的合成语音,提升用户的使用体验。 | ||
搜索关键词: | 一种 模拟 用户 说话 语音 合成 方法 系统 | ||
【主权项】:
一种模拟用户说话的语音合成方法,其特征在于,包括:步骤S1,获取外部输入的一段待模拟语音;步骤S2,将所述待模拟语音识别为对应的包括多个顺序排列的基本音子的发音文本;步骤S3,根据所述待模拟语音分别处理得到所述发音文本中每个基本音子的发音时段信息;步骤S4,将所述发音文本和所述发音时段信息送入包括一预先训练形成的语音合成模型的语音合成器中,以得到对应于所述待模拟语音的合成语音并输出。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于芋头科技(杭州)有限公司,未经芋头科技(杭州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711080690.6/,转载请声明来源钻瓜专利网。