[发明专利]一种基于HMM的蒙古语语音合成及前端处理的方法有效
申请号: | 201310595871.8 | 申请日: | 2013-11-25 |
公开(公告)号: | CN103632663A | 公开(公告)日: | 2014-03-12 |
发明(设计)人: | 飞龙;高光来;赵建东;张学良 | 申请(专利权)人: | 飞龙 |
主分类号: | G10L13/08 | 分类号: | G10L13/08;G10L15/14 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 010021 内蒙古*** | 国省代码: | 内蒙古;15 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 hmm 蒙古语 语音 合成 前端 处理 方法 | ||
技术领域
本发明属于语音合成技术领域,尤其涉及一种基于HMM的蒙古语语音合成及前端处理的方法。
背景技术
语音合成是实现人机语音通信的一项关键技术,它涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,是信息处理领域的一项前沿技术,解决的主要问题就是如何将文字信息转化为可听的声音信息,就是让机器像人一样开口说话。
当今主流的语音合成方法是基于HMM的语音合成技术,与基于大语料库的波形拼接技术相比,它具有可以在短时间内,基本不需要人工干预的情况下自动构建出一个新系统,而且整个训练过程基本上不依赖于发音人、发音风格以及情感等因素的优点,在汉语、英语、日语等方面已经有了许多可以应用的语音合成系统。在蒙古语的语音合成方面,前人做了基于大语料库的波形拼接方法方面的研究。这些研究工作对于蒙古语语音合成的发展具有重要意义,但是基于HMM的蒙古语语音合成研究还处于初级阶段。研究基于HMM的蒙古语音合成技术和构建基于HMM的蒙古语的语音合成系统,对于少数民族地区的教育、交通、通讯、自动化办公具有重要的意义。
现有技术一,基于词干词缀的蒙古语语音合成方法:
首先由文本分析模块对输入的文本进行格式化处理,记录要发音的单词及标点符号,滤除不发音的字符;然后对每一个单词,首先在词干表中进行查找,如果找到该单词原形,则提取对应的语音数据;如果在词干表中找不到,则需要进行词干词缀的切分,以便找到该词对应的词干词缀,同时进行该单词的词干词缀所对应的语音数据的提取。接着记录韵律特征,并利PSOLA算法进行韵律修改。最后根据拼接规则对选取的语音音段进行拼接,产生最终的合成语音;
技术方案文本分析模块需要处理文本格式化和词干词缀的切分等问题。在系统中,当遇到用英文表示的符号或英文单词时只进行简单的处理,就是依次读出每个英文字母,不进行进一步的考虑.对于文本分析中得到的每个词,首先在词干表中进行查找,如果找到该词,则提取语音数据,如果找不到则进行词干词缀的切分。蒙古语中的词可能只进行一次切分就能找到对应的词干词缀,有时可能需要对切分后的词干进行二次切分,或进行多次切分,所以提出了多级词干词缀切分器的概念;
通过在文本分析模块记录每个单词的韵律特征来表示词组、句子的韵律特征。通过记录单词的时长变化、基频变化和振幅的变化来表达单词的重音,词组中每个词的时长变化、重音变化,句子语气的变化(包括重音、时长和基频)。文本分析后,得出每个单词的韵律变化特征,系统中通过TDPSOLA和FD-PSOLA来进行修改,最终得到修改后的语音音段;
语音合成单元的拼接最常用的有三种算法:双音子拼接、硬拼接、软拼接。硬拼接的方法是一种简单的将两个语音放在一起(简单拼接)的方法。软拼接,拼接的位置同样位于两个音段的边界处。但是,通过引入自然语言中的过渡特性来平滑语音拼接处的过渡情况。两个语音基元之间可能需要某种重叠。在语音拼接合成中,如果只使用硬拼接,合成后的语音听起来时快时慢,抖动很大,缺乏连贯性。所以在本技术方案中,进行拼接时采用了硬拼接和软拼接结合的方法。系统中采用首尾交叠的软拼接方法进行过渡。所谓首尾交叠的软拼接方法为:对前一语音单元的尾部和后一语音单元的首部进行一定长度的波形叠加。当然前一语音音段和后一语音音段叠加部分长度的选取至关重要。通过总结出叠加的长度等于待叠加两个语音单元最小长度的八分之一左右比较合适。这样既可以保证合成后词和词之间的语音连贯、流畅,又可使读音清晰,提高了语音合成的自然度。
现有技术的缺点:基于大数据库的波形拼接一般需要使用一个很大的音库,这就阻碍了它在移动设备或嵌入式设备中的应用;其次,波形拼接的方法合成的声音较为单一,如果需要改变合成声音的性别、年龄等特征,则需要重新建立一个音库,所需的投入很大;而且,虽然有很多韵律调整的拼接算法,但对基音周期和时长调整的范围还是有限,如果调整比较大,合成语音的自然度会明显下降。
发明内容
本发明实施例的目的在于提供一种基于HMM的蒙古语语音合成及前端处理的方法,旨在解决现有的蒙古语语音合成方法存在的合成成本大、基音周期和时长调整的范围有限的问题。
本发明实施例是这样实现的,一种基于HMM的蒙古语语音合成的方法,该基于HMM的蒙古语语音合成的方法包括以下步骤:
步骤一,首先要对音库中的语音数据进行分析,提取出相应的语音参数;
步骤二,根据提取出的语音参数,HMM的观测向量可以分为谱和基频两个部分,总结对上下文属性集和用于决策树聚类的问题集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于飞龙,未经飞龙许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310595871.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:嵌有均水片的直接蒸发填料
- 下一篇:一种柴油机转速测量装置