[发明专利]定位语音中的关键词的方法和设备以及语音识别系统有效
| 申请号: | 200610152758.2 | 申请日: | 2006-09-27 |
| 公开(公告)号: | CN101154379A | 公开(公告)日: | 2008-04-02 |
| 发明(设计)人: | 李丰芹;吴亚栋;杨庆涛;陈晨 | 申请(专利权)人: | 夏普株式会社 |
| 主分类号: | G10L15/08 | 分类号: | G10L15/08;G10L15/00;G10L15/02;G10L15/28 |
| 代理公司: | 中科专利商标代理有限责任公司 | 代理人: | 王波波 |
| 地址: | 日本*** | 国省代码: | 日本;JP |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 定位 语音 中的 关键词 方法 设备 以及 识别 系统 | ||
技术领域
本发明涉及一种用于定位语音中的关键词的方法和设备,以及语音识别系统,具体地讲,涉及一种基于语音特征空间轨迹匹配来对语音中的关键词进行定位的方法和设备,以及利用该设备的语音识别系统,能够提高定位和识别的速度,并同时保证识别的精度。
背景技术
近年来,越来越多的信息终端装置,例如PC(个人计算机)、PDA(个人数字助理)、移动电话和遥控器等具备了语音输入功能,从而允许使用者通过发出语音来输入命令或者输入关键词。也就是说,需要这样的信息终端装置能够从用户输入的未知语音串中识别出用户想要输入的关键词。因此,如何准确和快速地确定关键词的位置是语音识别技术中一个重要的问题。
文献1(‘变帧速率技术在语音识别中的应用’,孙放,胡光锐,虞晓,上海交通大学学报,第32卷,第8期,1998年8月)提出了将变帧速率技术应用于语音识别,用来丢弃那些特征非常相似的音频帧,从而达到快速识别输入语音的目的。在文献1中通过使用数学求导方法并定义合适的阈值,来进行语音特征的归并,进而获得具有音韵特征结构的语音特征矢量序列。但是上述阈值的设定非常困难,并且会直接影响到识别的精度。此外,文献1所提出的方法使用非线性匹配,因此需要在关键词识别过程中进行大量的计算。
文献2(‘KEYWORD SPOTTING METHOD BASED ON SPEECHFEATURE SPACE TRACE MATCHING’,Ya-dong Wu,Bao-long Liu,Proceedings of the Second Conference on Machine Learning andCybernetics,2003年11月2-5日)提出通过计算特征矢量空间中矢量之间的距离并定义合适的阈值来进行语音特征归并,进而获得具有音韵特征结构的语音特征矢量序列。但是,由于这种归并是针对特定说话人语音的,因此表征同一音韵特征的代表特征点本身含有很多说话人的特征信息,变动较大。这样,在后续匹配过程中,不得不对语音轨迹进行重新刻度才能进行识别,由此增加了识别的复杂度。并且,文献2的技术没有很好地解决重新刻度的问题,因此识别的精度也很难保证。此外,计算矢量间距离所需的计算量非常大,为进行特征归并而设定合适的阈值也非常困难,且这个阈值的设定直接影响到具有音韵结构特征的语音轨迹估计是否准确。这些原因导致后续的基于此语音特征空间轨迹的匹配准确度不高。
另外,在关键词模板建立方面,文献2的技术也是采用这种归并方法进行关键词语音特征空间轨迹估计,其中关键词内容是针对特定识别任务域设计的。具体来说,该关键词语音轨迹不是通过多种应用领域的语料训练而产生的,很难直接应用到非特定人领域。当任务域改变时,必须重新制作关键词语音模板。因此,在文献2的技术中,关键词语音轨迹模板不具有通用性,在实际应用中有一定困难。
由于上述的问题,文献1和文献2所提出的方法无法实际应用到信息终端装置中。因此,需要一种能够快速定位输入的语音中的关键词并且能够减小计算量的技术。
发明内容
鉴于现有技术的上述问题,完成了本发明。本发明的目的是提供一种基于语音特征空间轨迹匹配的、定位输入语音中的关键词的方法和设备,以及采用该设备的语音识别系统,能够提高定位和识别的速度,并同时保证识别的精度。
在本发明的一个方面,提出了一种定位待识别语音中的关键词的方法,包括步骤:提取构成所述待识别语音的各个帧的特征参数矢量,以形成用于描述待识别语音的特征参数矢量序列;利用包含多个码本矢量的码本对特征参数矢量序列进行规整化处理,以得到待识别语音在矢量空间中的特征轨迹;以及匹配预先存储的关键词模板轨迹和所述特征轨迹,以确定关键词的位置。
此外,根据本发明的实施例,所述规整化步骤包括:从所述特征参数矢量序列中提取代表性特征参数矢量,来表征所述特征轨迹。
此外,根据本发明的实施例,所述提取代表性特征参数矢量的步骤包括步骤:在所述码本中搜索与所述特征参数矢量最接近的码本矢量;用搜索的码本矢量的编号表示所述特征参数矢量;对连续用相同的码本矢量表示的特征参数矢量进行合并,以表示所述特征轨迹。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于夏普株式会社,未经夏普株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200610152758.2/2.html,转载请声明来源钻瓜专利网。





