[发明专利]分布式语音识别系统有效
申请号: | 00803548.2 | 申请日: | 2000-02-04 |
公开(公告)号: | CN1352787A | 公开(公告)日: | 2002-06-05 |
发明(设计)人: | 张承纯 | 申请(专利权)人: | 高通股份有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26 |
代理公司: | 上海专利商标事务所 | 代理人: | 吴蓉军 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分布式 语音 识别 系统 | ||
发明领域
本发明一般涉及通信领域,特别涉及语音识别系统。
发明背景
语音识别(VR)代表赋予机器模拟智能以识别用户或用户发声的命令并促进人机接口的最重要技术之一。VR还代表人们话音理解的关键技术。采用从声学语音信号中恢复语言消息的技术的系统被称为语音识别器。语音识别器一般包括声处理器,它提取获得入局原始话音的VR所需的一系列带信息特征或矢量;字解码器,它解码特征或矢量系列以提供有意义和所需的输出格式,诸如与输入说话(utterance)相对应的一系列语言字。为了增加给定系统的性能,需要进行训练来将系统设置有效参数。换句话说,系统在它能够起到最佳作用之前需要学习。
声处理器代表在语音识别器中的前端话音分析子系统。响应于输入话音信号,声处理器提供一种表示时间变化话音信号的特征的适当表示法。声处理器应丢弃无关信息,诸如背景噪声、信道失真、扬声器特征和说话方式。有效的声处理为语音识别器提供增强的声区别(acoustic discrimination)能力。为此,要分析的有用特征是短时间谱包络。表示短时间谱包络的两种常用频谱分析技术是线性预测编码(LPC)和基于滤波器组的频谱建模(filter-bank-basedspectral modeling)。在美国专利号5,414,796(已转让给本发明的受让人并作为参考资料在此引入)和L.B.Rabiner与R.W.Schafer所著的“话音信号的数字处理”(Digital Processing of Speech Signals 396-453(1978),作为参考资料在此引入)中描述了示例LPC技术。
处于安全原因,VR(一般称为话音识别)的使用变得越来越重要。例如,VR可用来代替在无线电话键盘上人工按键的工作。这在用户在开车时要打电话时特别有用。当使用没有VR的电话时,司机必需从方向盘上腾出一只手并在按键拨号的同时要看着键盘。这种动作增加了交通事故的可能性。话音使能的电话(即,为话音识别设计的电话)允许司机打电话,同时继续看路。此外,车辆上的免提配套系统允许司机在呼叫启动期间将两只手放在方向盘上。
话音识别装置分为依赖扬声器或不依赖扬声器装置。不依赖扬声器装置能够接受来自任何用户的语音命令。训练更加普遍的依赖扬声器的装置来识别来自特定用户的命令。依赖扬声器的VR装置一般在两个阶段操作,即,训练阶段和识别阶段。在训练阶段,VR系统提醒用户说在系统词汇表中的每个字一遍或两遍,从而系统能够对于这些特定字或短语学习用户的话音特征。另一方面,对于表示语音的(phonetic)VR装置,通过阅读覆盖语言中的所有音素的一篇或多篇短文可以完成训练。对于免提汽车配套设备的示例词汇表可包括键盘上的数字;关键字“呼叫”、“发送”、“拨号”、“删除”、“清除”、“添加”、“删除”、“历史”、“程序”、“是”和“否”;和预定数量的一般称为共同工作者、朋友或家庭成员的名字。一旦完成训练,用户就能够通过说出训练的关键字在识别阶段启动呼叫。例如,如果名字“John”是一个经训练的名字,那么用户能够通过说出短语“呼叫John”来启动对John的呼叫。VR系统识别字“呼叫(Call)”和“John”,而且能够拨出用户此前作为John的电话号码输入的号码。
传统的VR装置一般用数字信号处理器(DSP)或微处理器来分析入局语音采样、提取相关参数、解码参数并将解码的参数与存储的一组字或VR模板(template)相比较,所述模板包括VR装置的词汇表。把词汇表存储在非易失存储器中,诸如,快闪存储器。在具有DSP和微处理器(诸如,数字蜂窝电话)的传统VR系统中,非易失存储器一般可被微处理器访问,但是DSP不能访问。在这样的系统中,如果完全在微处理器中执行VR,那么微处理器通常缺乏计算能力,从而以合理的等待时间传递识别结果。另一方面,如果完全在DSP中执行VR,那么微处理器需要读取快闪存储器并将读取的内容传给DSP,因为DSP的单片存储器(on-chip memory)的尺寸相对较小不足以保持大VR模板。由于在DSP和微处理器之间的接口的典型低带宽限制了可在给定时间内在两个装置之间传递的数据量,因此这是冗长的过程。于是,需要VR装置有效地将DSP的计算能力与微处理器的存储器容量相结合。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高通股份有限公司,未经高通股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/00803548.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:反应堆控制系统和方法
- 下一篇:选择超高速缓冲存储器