[发明专利]一种对普通话重音进行层次化建模和预测的方法有效
申请号: | 201110200330.1 | 申请日: | 2011-07-18 |
公开(公告)号: | CN102254554A | 公开(公告)日: | 2011-11-23 |
发明(设计)人: | 陶建华;李雅 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L13/08 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 周国城 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 普通话 重音 进行 层次 建模 预测 方法 | ||
技术领域
本发明涉及人机交互中语音合成技术领域,尤其涉及一种对普通话重音进行层次化建模和预测的方法,具体地涉及普通话句重音、词重音的建模,以及基于最大熵模型的词重音、句重音的两层重音预测方法。
背景技术
准确的重音描述以及从文本信息中预测重音信息一直是语音合成至关重要的一步,是提高合成语音表现力、构建和谐人机交互技术的重要组成部分。重音模型能够刻画出语音中的抑扬顿挫与轻重缓急,进而提高合成语音的表现力和自然度。重音的建模与预测对语音合成,人机交互等的发展具有重要意义。
虽然,在这个领域已经有很多的研究工作,但是重音建模与预测还有很多问题至今没有很好的解决。其中,具有重音标注的用于语音合成的语料库较少,且在仅有的几个语料库中,都强调重音音节的分析研究,没有对轻音音节的分析。但是,从语音合成实验结果来看,合成结果之所以不理想,重要原因之一就是现有合成系统忽略了语音轻音的问题。轻音除了对语流中的轻重缓急起到一定的衬托作用,它还具有表义的作用,即具有区分词义的作用。
因此,为了提高合成语音的自然度和表现力,有必要加强轻音音节的研究,同时进一步提高重音音节的研究。
发明内容
(一)要解决的技术问题
为了解决现有技术问题,本发明的主要目的是要提出一种对普通话重音进行层次化建模和预测的方法,以更精确的描述语音中用于表现韵律凸显的重音现象,同时能够从任意输入的文本得到较为细致的重音等级标注结果。
(二)技术方案
为达到上述目的,本发明提供了一种对普通话重音进行层次化建模和预测的方法,该方法采用层次化重音描述体系对普通话重音进行描述,包括:
选择合适的重音描述体系,创建层级标注的重音语料库;
训练生成韵律词重音预测模型;
训练生成句重音预测模型;以及
根据韵律词重音模型与句重音预测模型结果综合生成每个音节的重音标注结果。
上述方案中,所述采用层次化重音描述体系对普通话重音进行描述,是采用句重音与韵律词重音对普通话重音进行描述,以重音凸显范围将普通话重音分为句重音与韵律词重音两个层级,对于句重音层级采用重音音节的建模分析,而对于韵律词重音层级采用轻音音节的建模分析。所述句重音用于表明在句子层面凸显的韵律词,所述韵律词重音用于表明韵律词内部音节之间的凸显对比。
上述方案中,所述选择合适的重音描述体系,是以重音凸显范围将普通话重音分为句重音与韵律词重音两个层级,然后针对不同的层级,选择不同的重音标注单元。所述重音标注单元分为两类:在韵律词重音中,重音标注单元为单个韵律词;在句重音标注中,标注单元为句子。所述创建层级标注的重音语料库,是在录音室录制语音数据,并进行音节切分,韵律边界标注,最后按照标注单元的重音凸显程度高低分别标注为3、2、1三个等级。
上述方案中,所述训练生成韵律词重音预测模型,是训练一个能够预测当前音节在其所在的韵律词范围内是轻音的概率的模型,训练的具体过程为:采用一文本特征参数提取模块,得到与韵律词重音特征相关的文本特征参数F1作为模型训练输入,利用最大熵模型,得到有关韵律词内部轻音节与非轻音节的文本特征差异,进而通过模型训练得到音节是轻音的概率,建立韵律词重音预测模型。所述韵律词重音预测模型具有一用于输出韵律词重音预测结果的输出端。
上述方案中,所述训练生成句重音预测模型,是训练一个能够预测当前音节在句子范围内是重音的概率的模型,训练的具体过程为:采用一文本特征参数提取模块,得到与句子级别重音预测相关的文本特征参数F2作为模型输入,利用最大熵模型,训练有关句子层级重音节与非重音节的文本特征差异,进而通过模型训练得到音节是重音的概率,建立句重音预测模型。所述句重音预测模型具有一输出句重音预测结果的输出端。
上述方案中,所述根据韵律词重音模型与句重音预测模型结果综合生成每个音节的重音标注结果,是将韵律词重音预测结果和句重音预测结果采用公式进行加权综合,然后输出综合后的层级重音标注信息;其中,和分别是音节在当前韵律词和句子中的重音凸显度,是韵律词在当前句子中的重音凸显度。
(三)有益效果
从上述技术方案可以看出,本发明具有以下有益效果:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110200330.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于自然语音识别的导航方法和系统
- 下一篇:小型量子纠缠源教学系统