[发明专利]一种语音合成方法、装置、存储介质和电子设备在审
申请号: | 201811597946.5 | 申请日: | 2018-12-26 |
公开(公告)号: | CN109830226A | 公开(公告)日: | 2019-05-31 |
发明(设计)人: | 张冉 | 申请(专利权)人: | 出门问问信息科技有限公司 |
主分类号: | G10L13/04 | 分类号: | G10L13/04;G06F17/27 |
代理公司: | 北京睿派知识产权代理事务所(普通合伙) 11597 | 代理人: | 刘锋 |
地址: | 100190 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 兴趣点 语音合成 存储介质 电子设备 发音 定位信息获取 定位信息 合成文本 信息合成 语音信息 准确率 | ||
本发明实施例提供了一种语音合成方法、装置、存储介质和电子设备。本发明实施例通过获取待合成文本中的兴趣点的信息,所述兴趣点的信息包括定位信息;根据所述定位信息获取对应的兴趣点名称的发音切分信息;根据所述发音切分信息合成所述兴趣点名称对应的语音信息。能够提高语音合成的准确率。
技术领域
本发明涉及语音合成技术领域,尤其涉及一种语音合成方法、装置、存储介质和电子设备。
背景技术
文本语音合成(Text-To-Speech,TTS)技术是用于从文本合成语音的技术,具体地说,是一种将任意文字信息转化为标准、流畅语音的技术。TTS涉及自然语言处理、韵律学、语音信号处理、声音感知等多种前沿的高新科技,横跨声学、语言学、数字信号处理等多个学科,是文字信息处理领域的一项前沿技术。
利用语音合成技术可以让机器像人那样说话,从而人们可以通过听觉方便地获得这些信息。如现有的语音导航系统就利用语音合成技术,从而用户可以通过听觉接收导航信息。
然而,现有的语音合成技术的准确率还有待提高。
发明内容
有鉴于此,本发明实施例提供了一种语音合成方法、装置、存储介质和电子设备,能够提高语音合成技术的准确率。
第一方面,本发明实施例提供一种语音合成方法,所述方法包括:
获取待合成文本中的兴趣点的信息,所述兴趣点的信息包括定位信息;
根据所述定位信息获取对应的兴趣点名称的发音切分信息;
根据所述发音切分信息合成所述兴趣点名称对应的语音信息。
优选地,所述定位信息为经纬度信息;
所述根据所述定位信息获取对应的兴趣点名称的发音切分信息包括:
根据所述兴趣点的经纬度获得发音切分信息,所述发音切分信息包括通过分隔标识分隔的多个发音单元。
优选地,所述根据所述发音切分信息合成所述兴趣点名称对应的语音信息包括:
获取多个发音单元的发音音素排列;
根据多个发音单元的发音音素排列合成所述语音信息。
优选地,所述获取多个发音单元的发音音素排列包括:
通过拼音到英文音素的映射词典获取发音音素排列。
优选地,所述获取多个发音单元的发音音素排列包括:
通过学习模型获取发音音素排列。
优选地,所述兴趣点名称包括:中国地名的英文文本。
第二方面,本发明实施例提供一种数据处理装置,所述装置包括:
兴趣点信息获取单元,用于获取待合成文本中的兴趣点的信息,所述兴趣点的信息包括定位信息;
发音切分信息获取单元,用于根据所述定位信息获取对应的兴趣点名称的发音切分信息;
语音合成单元,用于根据所述发音切分信息合成所述兴趣点名称对应的语音信息。
第三方面,本发明实施例提供一种计算机可读存储介质,其上存储计算机程序指令,所述计算机程序指令在被处理器执行时实现如第一方面所述的方法。
第四方面,本发明实施例提供一种电子设备,包括存储器和处理器,所述存储器用于存储一条或多条计算机程序指令,其中,所述一条或多条计算机程序指令被所述处理器执行以实现如第一方面所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于出门问问信息科技有限公司,未经出门问问信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811597946.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种降低无人机桨叶旋转噪声的方法及系统
- 下一篇:一种便携式英语口音识别装置