[发明专利]韵律事件检测方法和装置有效
申请号: | 201310487945.6 | 申请日: | 2013-10-17 |
公开(公告)号: | CN104575518B | 公开(公告)日: | 2018-10-02 |
发明(设计)人: | 刘加;赵军红;袁桦;张卫强;何亮;赵峰;邵颖 | 申请(专利权)人: | 清华大学;深圳市车音网科技有限公司 |
主分类号: | G10L25/03 | 分类号: | G10L25/03 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100084 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 韵律 事件 检测 方法 装置 | ||
本发明公开一种韵律事件检测方法和装置,涉及语音技术。为解决现有技术韵律事件检测的准确率较低的问题而发明。包括:接收到待检测语音时,获取预先训练一组受训语音得到的判别式模型M1、M2…Mn;以音节为单位划分待检测语音,得到至少一个待检测样本;提取每个待检测样本对应的待检测声学特征;使用判别式模型M1根据对应的待检测声学特征对每个待检测样本进行初步分类,得到每个待检测样本属于各个类别的第一概率;根据对应的联合检测特征,依次使用判别式模型M2…Mn分别对每个待检测样本进行分类,得到每个待检测样本属于各个类别的第二概率…第N概率;根据第N概率确定韵律检测结果。可以应用在自然语音的检测中。
技术领域
本发明涉及语音技术,尤其涉及一种韵律事件检测方法和装置。
背景技术
人们进行语言交流时,相互传递的不仅仅是语言文字信息,还包括超音段的韵律信息。因此,上下文信息对韵律事件的检测至关重要。目前,利用上下文信息进行韵律事件检测的方法包括:利用N-gram语言模型进行韵律事件检测,或利用CRF模型进行韵律事件检测。
其中,利用N-gram模型进行韵律事件检测时,使用的N-gram模型为
其中,P*={p1*,p2*…..,pn*}为韵律事件的标签序列,A={a1,a2,…an}是对应的声学特征序列,pi为第i个韵律事件。
然而,由于N-gram模型需要利用其历史状态进行检测,因此N-gram模型具有时序性的约束,使得利用N-gram模型进行韵律事件检测时,只能利用每个样本及其之前样本之间的关系,导致韵律事件检测的准确率较低。
发明内容
本发明的实施例提供一种韵律事件检测方法和装置,能够提高韵律事件检测的准确率。
为达到上述目的,本发明的实施例采用如下技术方案:
一种韵律事件检测方法,包括:接收到待检测语音时,获取预先训练一组受训语音得到的判别式模型M1、M2…Mn,n>1;以音节为单位划分所述待检测语音,得到至少一个待检测样本;分别从所述至少一个待检测样本中提取每个待检测样本对应的待检测声学特征;使用所述判别式模型M1根据对应的待检测声学特征对每个待检测样本进行初步分类,得到每个待检测样本属于各个类别的第一概率;根据对应的联合检测特征,依次使用所述判别式模型M2…Mn分别对每个待检测样本进行分类,得到每个待检测样本属于各个类别的第二概率…第N概率;根据所述第N概率确定所述至少一个待检测样本的韵律检测结果;所述对应的联合检测特征,包括:根据所使用的判别式模型的前一个判别式模型对所述至少一个待检测样本中目标样本分类后得到的待检测本地概率;根据所述前一个判别式模型对所述至少一个待检测样本中目标样本的相邻预设相邻数目个待检测样本分类后得到的待检测相邻概率;以及根据每个待检测样本对应的待检测声学特征,获取的所述目标样本对应的待检测声学特征。
一种韵律事件检测装置,包括:
模型获取模块,用于接收到待检测语音时,获取预先训练一组受训语音得到的判别式模型M1、M2…Mn,n>1;
待检测音节划分模块,与所述模型获取模块相连,用于以音节为单位划分所述模型获取模块接收的待检测语音,得到至少一个待检测样本;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学;深圳市车音网科技有限公司,未经清华大学;深圳市车音网科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310487945.6/2.html,转载请声明来源钻瓜专利网。