[发明专利]基于韵律短语的韵律结构生成方法有效
申请号: | 200910091510.3 | 申请日: | 2009-08-26 |
公开(公告)号: | CN101650942A | 公开(公告)日: | 2010-02-17 |
发明(设计)人: | 董远;周涛 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G10L13/08 | 分类号: | G10L13/08;G06N1/00;G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100876*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 韵律 短语 结构 生成 方法 | ||
技术领域
本发明属于计算机人机交流领域,设计了以韵律短语为基础的多层韵律结构生成方法。 本发明在韵律边界结构的预测中,引入了机器学习的方法,并且对韵律短语和韵律词进行分 层处理。在系统分析和归纳的前提下,有针对性地设计韵律短语和韵律词的特征模版,并采 用最大熵算法等机器学习的方法,设计了一种能够有效、准确生成韵律边界信息的体系,适 用于语音合成等实际应用中。
背景技术
随着信息技术、语言技术以及计算机技术的发展,语音合成技术已经越来越多的受到人 们的关注。可以通过输入文本,让计算机像人一样说出具有高自然度和智能度的语音。这项 技术已被广泛应用于电信服务,嵌入式移动设备等各方面。
目前合成语音已经具备了很高的可懂度,但是其自然度还是不尽如人意。一方面音质有 差距,由于语音合成通常需要从语音中提取参数,然后对这些参数作适当的变换再返回合成 语音,这个过程往往会带来语音音质的损失;另一方面就是韵律的差距,现在的语音合成系 统大多只能生成固定语调模式的语句,由于对语句中的停顿、轻重、长短、速度、升降调等 的不当处理,使合成语音听起来枯燥、呆板。如何自动生成高质量的韵律信息越来越受到研 究者的关注。
韵律生成的一个主要障碍在于如何从文本中自动确定韵律的层级,而韵律的层级划分现 在并没有一个统一的标准,一般来说,一个句子的韵律结构可划分为三层:韵律词、韵律短 语、语调短语。其中韵律词可以看作是基本节奏单元,主要是双音节和三音节组块,相当于 韵律音系学上的标准音步和加强音步(超音步);而韵律短语是中等的节奏组块,可以看作一 个气群,研究表明每个气群中的音节从左向右存在调域收缩的规律;语调短语则是由若干韵 律短语组成,虽然语调短语末尾的音节调域也要发生变化,但是它更侧重于决定句子的句调。
近年来,越来越多的研究都集中在基于机器学习的方法来预测韵律结构,如 Classification And Regression Tree(CART)和决策树(Decision Tree)的方法,这些方法都 取得了一定的效果。但是单一的CART或者决策树的方法都没有考虑韵律词边界间的依赖关
———————
收稿日期:
基金项目:受教育部科学技术研究重点项目(108012)资助
作者简介:
系,并且往往受到数据稀疏等问题的困扰。隐马模型(HMM,Hidden Markov Model)也被应用 于预测韵律结构,并且使预测的正确率有了较大的提高。但是HMM由于其输出的独立性假设, 导致其不能考虑上下文的特征,限制了特征的选取。
本发明通过分析大规模语料库中韵律结构特征,制订了一种基于韵律短语的韵律结构生 成方法。本发明采用分层结构,先对语料中的韵律短语边界进行判断,再生成韵律词边界。 在每一层次的处理中,都引入了最大熵模型和错误驱动的机器学习的方法,并在最后设定相 应的规则进行修正,以使生成的韵律结构边界的准确率最高。
发明的内容
为了有效并且正确的生成韵律结构边界,本发明通过对大规模语料的研究,充分调查了 韵律短语对韵律结构的重要影响,提出了一种基于韵律短语的韵律结构生成方法。语音学和 语言学的研究表明,语音材料在韵律上具有树状层次结构,韵律层次主要分为三个基本层次: 韵律词、韵律短语和语调短语。韵律词也叫音素词,是发生变调等音素变化的最小辖域,相 当于韵律结构中的最小发音单位。韵律短语是介于韵律词和语调短语之间的韵律单位,一般 由一个或几个韵律词组成,跨度为7个音节左右,最多不超过9个。语法短语相当于语法上 较短的句子或较长的短语,是句子层面上的音系规则作用的辖域,一般都以标点符号予以区 分。实验表明,这三个层次中,韵律短语对韵律结构的生成影响最大,具有决定性的作用。 基于这种情况,本发明采取分层结构生成韵律边界信息。整个系统的输入文本为已经经过分 词和词性标注的xml文件。第一阶段分词边界的基础上,生成韵律短语边界信息,并且予以 标注;然后第二阶段在分词和韵律短语信息的基础上,判断韵律词边界;最后,设计一系列 具有针对性的规则,对结果中的一些常见错误进行修正,进一步提高韵律结构预测的准确率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910091510.3/2.html,转载请声明来源钻瓜专利网。