[发明专利]汉语连续语音识别系统无效
申请号: | 02146100.7 | 申请日: | 2002-11-06 |
公开(公告)号: | CN1499484A | 公开(公告)日: | 2004-05-26 |
发明(设计)人: | 王作英;吴及;肖熙;孙甲松;王侠 | 申请(专利权)人: | 北京天朗语音科技有限公司 |
主分类号: | G10L15/14 | 分类号: | G10L15/14 |
代理公司: | 北京万慧达知识产权代理有限公司 | 代理人: | 苏瑞 |
地址: | 100029北京市朝阳区裕*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种采用基于段长分布的隐含马尔可夫模型的汉语连续语音识别系统,包括语音采集装置、前端处理模块、特征提取模块、基音特征提取模块、声调识别模块、训练模块、声学层识别模块、拼音文法理解模块、语言理解模块;通过训练模块得到码本和模型参数;通过声学层识别模块对MFCC语音特征序列的搜索算法,产生拼音格形式的识别结果,同时,语音信号的基音特征矢量也被提取出来,送入声调识别模块,声调识别模块利用基音特征信息和拼音的分割点信息,得到拼音的声调信息并加入到拼音格中,接着,通过拼音文法理解模块对拼音格进行修剪,送入语言理解模块,转化为拼音图和词图,并在词图中进行搜索,得到最后的理解结果。 | ||
搜索关键词: | 汉语 连续 语音 识别 系统 | ||
【主权项】:
1、一种汉语连续语音识别系统,其特征在于:所述的汉语连续语音识别系统包括语音采集装置、前端处理模块、特征提取模块、基音特征提取模块、声调识别模块、训练模块、声学层识别模块、拼音文法理解模块、语言理解模块九个部分,该声学层识别模块采用以状态的段长概率来表示的隐含马尔可夫模型,即基于段长分布的隐含马尔可夫模型,简称DDBHMM模型,该模型的段长服从具有凸性的分布,其中,该模型中的状态与语音中的音素或音节等语音单元相对应,而这些语音单元读音的语音信号特征作为对应语音单元的观测量;该训练模块的训练方法步骤如下:对训练模块输入一个或多个包含有若干特定词的读音样本文件,该文件中的每句话的一系列帧的特征向量以帧为单位,通过训练模块中的训练搜索算法,对每帧语音信号中的每个词的每个状态进行搜索比较,得到语音信号特征矢量的矢量量化码本(VQ码本)和该特定词的DDBHMM模型参数,输入给声学层识别模块;所述的汉语连续语音识别系统的语音识别方法步骤如下:通过语音采集装置接收人们的语音信号,对于输入的语音信号进行前端处理,并进行MFCC语音特征(基于Mel倒谱系数的语音特征,Mel-Frequency CepstralCoefficients)序列的提取,得到的该MFCC语音特征序列被送入声学层识别模块,通过声学层识别模块的搜索算法,产生拼音格形式的识别结果,同时,语音信号的基音特征矢量也被提取出来,送入声调识别模块,声调识别模块利用基音特征信息和拼音的分割点信息,得到拼音的声调信息并加入到拼音格中,接着,通过拼音文法理解模块对拼音格进行修剪,精简后的音节格被送入语言理解模块,转化为拼音图和词图,并在词图中进行搜索,得到最后的理解结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京天朗语音科技有限公司,未经北京天朗语音科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/02146100.7/,转载请声明来源钻瓜专利网。
- 上一篇:电磁声电变换器
- 下一篇:音频信息变换方法、程序和设备及视/音频格式、编码器