[发明专利]一种对普通话重音进行层次化建模和预测的方法有效

申请号：	201110200330.1	申请日：	2011-07-18
公开（公告）号：	CN102254554A	公开（公告）日：	2011-11-23
发明（设计）人：	陶建华;李雅	申请（专利权）人：	中国科学院自动化研究所
主分类号：	G10L15/06	分类号：	G10L15/06;G10L13/08
代理公司：	中科专利商标代理有限责任公司 11021	代理人：	周国城
地址：	100190 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种普通话重音进行层次建模预测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种对普通话重音进行层次化建模和预测的方法，其特征在于，该方法采用层次化重音描述体系对普通话重音进行描述，包括：

选择合适的重音描述体系，创建层级标注的重音语料库；

训练生成韵律词重音预测模型；

训练生成句重音预测模型；以及

根据韵律词重音模型与句重音预测模型结果综合生成每个音节的重音标注结果。

2.根据权利要求1所述的对普通话重音进行层次化建模和预测的方法，其特征在于，所述采用层次化重音描述体系对普通话重音进行描述，是采用句重音与韵律词重音对普通话重音进行描述，以重音凸显范围将普通话重音分为句重音与韵律词重音两个层级，对于句重音层级采用重音音节的建模分析，而对于韵律词重音层级采用轻音音节的建模分析。

3.根据权利要求2所述的对普通话重音进行层次化建模和预测的方法，其特征在于，所述句重音用于表明在句子层面凸显的韵律词，所述韵律词重音用于表明韵律词内部音节之间的凸显对比。

4.根据权利要求1所述的对普通话重音进行层次化建模和预测的方法，其特征在于，所述选择合适的重音描述体系，是以重音凸显范围将普通话重音分为句重音与韵律词重音两个层级，然后针对不同的层级，选择不同的重音标注单元。

5.根据权利要求4所述的对普通话重音进行层次化建模和预测的方法，其特征在于，所述重音标注单元分为两类：在韵律词重音中，重音标注单元为单个韵律词；在句重音标注中，标注单元为句子。

6.根据权利要求5所述的对普通话重音进行层次化建模和预测的方法，其特征在于，所述创建层级标注的重音语料库，是在录音室录制语音数据，并进行音节切分，韵律边界标注，最后按照标注单元的重音凸显程度高低分别标注为3、2、1三个等级。

7.根据权利要求1所述的对普通话重音进行层次化建模和预测的方法，其特征在于，所述训练生成韵律词重音预测模型，是训练一个能够预测当前音节在其所在的韵律词范围内是轻音的概率的模型，训练的具体过程为：采用一文本特征参数提取模块，得到与韵律词重音特征相关的文本特征参数F1作为模型训练输入，利用最大熵模型，得到有关韵律词内部轻音节与非轻音节的文本特征差异，进而通过模型训练得到音节是轻音的概率，建立韵律词重音预测模型。

8.根据权利要求7所述的对普通话重音进行层次化建模和预测的方法，其特征在于，所述韵律词重音预测模型具有一用于输出韵律词重音预测结果的输出端。

9.根据权利要求1所述的对普通话重音进行层次化建模和预测的方法，其特征在于，所述训练生成句重音预测模型，是训练一个能够预测当前音节在句子范围内是重音的概率的模型，训练的具体过程为：采用一文本特征参数提取模块，得到与句子级别重音预测相关的文本特征参数F2作为模型输入，利用最大熵模型，训练有关句子层级重音节与非重音节的文本特征差异，进而通过模型训练得到音节是重音的概率，建立句重音预测模型。

10.根据权利要求1所述的对普通话重音进行层次化建模和预测的方法，其特征在于，所述句重音预测模型具有一输出句重音预测结果的输出端。

11.根据权利要求1所述的对普通话重音进行层次化建模和预测的方法，其特征在于，所述根据韵律词重音模型与句重音预测模型结果综合生成每个音节的重音标注结果，是将韵律词重音预测结果和句重音预测结果采用公式进行加权综合，然后输出综合后的层级重音标注信息；其中，和分别是音节在当前韵律词和句子中的重音凸显度，是韵律词在当前句子中的重音凸显度。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所，未经中国科学院自动化研究所许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201110200330.1/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种对普通话重音进行层次化建模和预测的方法有效

专利文献下载