[发明专利]基于韵律短语的韵律结构生成方法有效

专利信息
申请号: 200910091510.3 申请日: 2009-08-26
公开(公告)号: CN101650942A 公开(公告)日: 2010-02-17
发明(设计)人: 董远;周涛 申请(专利权)人: 北京邮电大学
主分类号: G10L13/08 分类号: G10L13/08;G06N1/00;G06F17/30
代理公司: 暂无信息 代理人: 暂无信息
地址: 100876*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 韵律 短语 结构 生成 方法
【说明书】:

技术领域

发明属于计算机人机交流领域,设计了以韵律短语为基础的多层韵律结构生成方法。 本发明在韵律边界结构的预测中,引入了机器学习的方法,并且对韵律短语和韵律词进行分 层处理。在系统分析和归纳的前提下,有针对性地设计韵律短语和韵律词的特征模版,并采 用最大熵算法等机器学习的方法,设计了一种能够有效、准确生成韵律边界信息的体系,适 用于语音合成等实际应用中。

背景技术

随着信息技术、语言技术以及计算机技术的发展,语音合成技术已经越来越多的受到人 们的关注。可以通过输入文本,让计算机像人一样说出具有高自然度和智能度的语音。这项 技术已被广泛应用于电信服务,嵌入式移动设备等各方面。

目前合成语音已经具备了很高的可懂度,但是其自然度还是不尽如人意。一方面音质有 差距,由于语音合成通常需要从语音中提取参数,然后对这些参数作适当的变换再返回合成 语音,这个过程往往会带来语音音质的损失;另一方面就是韵律的差距,现在的语音合成系 统大多只能生成固定语调模式的语句,由于对语句中的停顿、轻重、长短、速度、升降调等 的不当处理,使合成语音听起来枯燥、呆板。如何自动生成高质量的韵律信息越来越受到研 究者的关注。

韵律生成的一个主要障碍在于如何从文本中自动确定韵律的层级,而韵律的层级划分现 在并没有一个统一的标准,一般来说,一个句子的韵律结构可划分为三层:韵律词、韵律短 语、语调短语。其中韵律词可以看作是基本节奏单元,主要是双音节和三音节组块,相当于 韵律音系学上的标准音步和加强音步(超音步);而韵律短语是中等的节奏组块,可以看作一 个气群,研究表明每个气群中的音节从左向右存在调域收缩的规律;语调短语则是由若干韵 律短语组成,虽然语调短语末尾的音节调域也要发生变化,但是它更侧重于决定句子的句调。

近年来,越来越多的研究都集中在基于机器学习的方法来预测韵律结构,如 Classification And Regression Tree(CART)和决策树(Decision Tree)的方法,这些方法都 取得了一定的效果。但是单一的CART或者决策树的方法都没有考虑韵律词边界间的依赖关

———————

收稿日期:

基金项目:受教育部科学技术研究重点项目(108012)资助

作者简介:

系,并且往往受到数据稀疏等问题的困扰。隐马模型(HMM,Hidden Markov Model)也被应用 于预测韵律结构,并且使预测的正确率有了较大的提高。但是HMM由于其输出的独立性假设, 导致其不能考虑上下文的特征,限制了特征的选取。

本发明通过分析大规模语料库中韵律结构特征,制订了一种基于韵律短语的韵律结构生 成方法。本发明采用分层结构,先对语料中的韵律短语边界进行判断,再生成韵律词边界。 在每一层次的处理中,都引入了最大熵模型和错误驱动的机器学习的方法,并在最后设定相 应的规则进行修正,以使生成的韵律结构边界的准确率最高。

发明的内容

为了有效并且正确的生成韵律结构边界,本发明通过对大规模语料的研究,充分调查了 韵律短语对韵律结构的重要影响,提出了一种基于韵律短语的韵律结构生成方法。语音学和 语言学的研究表明,语音材料在韵律上具有树状层次结构,韵律层次主要分为三个基本层次: 韵律词、韵律短语和语调短语。韵律词也叫音素词,是发生变调等音素变化的最小辖域,相 当于韵律结构中的最小发音单位。韵律短语是介于韵律词和语调短语之间的韵律单位,一般 由一个或几个韵律词组成,跨度为7个音节左右,最多不超过9个。语法短语相当于语法上 较短的句子或较长的短语,是句子层面上的音系规则作用的辖域,一般都以标点符号予以区 分。实验表明,这三个层次中,韵律短语对韵律结构的生成影响最大,具有决定性的作用。 基于这种情况,本发明采取分层结构生成韵律边界信息。整个系统的输入文本为已经经过分 词和词性标注的xml文件。第一阶段分词边界的基础上,生成韵律短语边界信息,并且予以 标注;然后第二阶段在分词和韵律短语信息的基础上,判断韵律词边界;最后,设计一系列 具有针对性的规则,对结果中的一些常见错误进行修正,进一步提高韵律结构预测的准确率。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200910091510.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top