[发明专利]基于人工智能的生成g2p模型和英文语音合成方法、装置在审
申请号: | 201610122171.0 | 申请日: | 2016-03-03 |
公开(公告)号: | CN105679308A | 公开(公告)日: | 2016-06-15 |
发明(设计)人: | 陈志杰;康永国 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L13/08 | 分类号: | G10L13/08;G10L15/06;G10L15/16 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人工智能 生成 g2p 模型 英文 语音 合成 方法 装置 | ||
技术领域
本发明涉及语音合成技术领域,尤其涉及一种基于人工智能的生成g2p 模型和英文语音合成方法、装置。
背景技术
人工智能(ArtificialIntelligence,AI)是研究、开发用于模拟、延 伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工 智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能 以人类智能相似的方式做出反应的智能机器,该领域的研究包括智能机器人、 语言识别、图像识别、自然语言处理和专家系统等。
语音合成,又称文语转换(TexttoSpeech)技术,能将任意文字信息实 时转化为标准流畅的语音朗读出来。在英文语音合成中,一个重要模块是利用 g2p模型进行转换的模块,g2p模型的全称是grapheme-to-phoneme模型,用 于将字母转换为音素。
相关技术中,g2p模型的训练主要依赖统计语言模型的方法,模型的平滑 策略也和统计语言模型一模一样。但随着模型阶数的增大,模型的占用空间资 源也就更大了。
相关技术中,如果要保证g2p模型的性能,就需要占用较大的空间资源; 如果要降低对空间资源的占用,就要牺牲模型的性能以减小模型大小,无疑会 影响英文语音合成效果。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的一个目的在于提出一种基于人工智能的生成g2p模型的方 法,该方法可以在提高g2p模型性能的基础上,减小g2p模型的大小,进而提 高英文语音合成效果。
本发明的另一个目的在于提出一种基于人工智能的生成g2p模型的装置。
本发明的另一个目的在于提出一种基于人工智能的英文语音合成方法。
本发明的另一个目的在于提出一种基于人工智能的英文语音合成装置。
为达到上述目的,本发明第一方面实施例提出的基于人工智能的生成g2p 模型的方法,包括:获取用于训练g2p模型的语料;采用神经网络对所述语料 进行训练,得到g2p模型。
本发明第一方面实施例提出的基于人工智能的生成g2p模型的方法,通过 神经网络生成g2p模型,可以在提高g2p模型的性能的基础上降低g2p模型的 大小。
为达到上述目的,本发明第二方面实施例提出的基于人工智能的生成g2p 模型的装置,包括:获取模块,用于获取用于训练g2p模型的语料;训练模块, 用于采用神经网络对所述语料进行训练,得到g2p模型。
本发明第二方面实施例提出的基于人工智能的生成建g2p模型的装置,通 过神经网络生成g2p模型,可以在提高g2p模型的性能的基础上降低g2p模型 的大小。
为达到上述目的,本发明第三方面实施例提出的基于人工智能的英文语音 合成方法,包括:获取g2p模型;采用所述g2p模型进行英文语音合成;其中, 所述g2p模型采用如本发明第一方面实施例任一项所述的方法生成。
本发明第三方面实施例提出的基于人工智能的英文语音合成方法,通过采 用上述的采用神经网络训练生成的g2p模型进行英文语音合成,可以提升英文 语音合成效果。
为达到上述目的,本发明第四方面实施例提出的基于人工智能的英文语音 合成装置,包括:获取模块,用于获取g2p模型;合成模块,用于采用所述 g2p模型进行英文语音合成;其中,所述g2p模型采用如本发明第一方面实施 例任一项所述的方法生成。
本发明第四方面实施例提出的基于人工智能的英文语音合成装置,通过采 用上述的采用神经网络训练生成的g2p模型进行英文语音合成,可以提升英文 语音合成效果。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描 述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中 将变得明显和容易理解,其中:
图1是本发明一实施例提出的基于人工智能的生成g2p模型的方法的流 程示意图;
图2是本发明实施例中一种BLSTM网络的示意图;
图3是本发明实施例中另一种BLSTM网络的示意图;
图4是本发明另一实施例提出的基于人工智能的英文语音合成方法的流 程示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610122171.0/2.html,转载请声明来源钻瓜专利网。