[发明专利]强健型知觉语音处理系统及方法无效
| 申请号: | 01124049.0 | 申请日: | 2001-08-08 |
| 公开(公告)号: | CN1400585A | 公开(公告)日: | 2003-03-05 |
| 发明(设计)人: | 卜令楷;阙志达 | 申请(专利权)人: | 韦尔博泰克公司 |
| 主分类号: | G10L15/20 | 分类号: | G10L15/20 |
| 代理公司: | 永新专利商标代理有限公司 | 代理人: | 韩宏 |
| 地址: | 美国加利*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 强健 知觉 语音 处理 系统 方法 | ||
发明领域
本发明关于一种自动语音辨识系统,尤其是关于一种能够改善自动语音辨识系统的强健度的知觉语音处理系统。
发明背景
自动语音辨识(ASR)系统已发展超过了三十年以上,并且已能于实验室中经由诸项受控设定来实现高度的辨识准确率。然而,在实际谈话环境中针对不利状况的强健度问题仍然存在,因为在真实的谈话环境的中包含有背景的噪音、语音失真、以及个人特殊发音等特征的缘故。来自于人们说话与移动、器械、机器、交通等等的背景噪音存在于几乎是任何环境之中,例如在家中、办公室中、车内、或者是在公共场所之中。语音频谱的失真则可能起因于频率响应、麦克风的安装位置、以及麦克风的传感器品质等等,并且可能起因于信号传输线路的干扰。再者,每个说话人具有其自身独特的发音习惯,甚至在针对同一说话人的情况下,由于该语音当时的情绪反应而将可能会造成声调变化的发生(伦巴效应)。因此,自动语音辨识系统必须足够强健来对抗不利的说话环境,以便能够实现高度正确的语音辨识。
传统式自动语音辨识系统已通过使用具有相同的噪声成份且从语音训练所得的参考样本,来尝试解决强健度的问题,但此方式无法处理不同的不利环境,因此其并不实用。改善强健度的其他方法包括有信号增强的预先处理,此通过在辨识处理前进行噪音的抑制;例如是使用两个信号源来进行噪音消除。然而,此一方法所需要的是在不良信号中的噪声成份以及基准噪声中必须具有一种高度的相关性,举例来说,为了抑制汽车的引擎噪音,用于这两个信号源的麦克风无法分离超过5公分以上,因此无法防止语音本身被包括在基准噪声之中。另一种方法为使用例如是噪声功率以及/或者信噪比SNR等噪声特征的估算,并将其加至一个清晰的语音资料库中,用以建构出一种能够使一噪声频谱成份对应至噪声抑制数值的函数(复合模型频谱)。然而,该方法受限于一种对于噪声估算的良好假设的需求(因而降低了处理不可预期的噪音环境的能力)以及高度的计算复杂性。
噪声消除用麦克风(隔膜两侧暴露于声域之中)以及多感应器配置能够提升SNR,不过麦克风以及感应器必须被精确地加以定位,并且操作算法需要特定适合的训练,因此其一般性的使用受到了限制。
对于宽波段噪音环境而言,较低波段的语音区域将更容易受到噪音的影响。经由滤波器组分析器所进行的噪音屏蔽针对滤波器的每一个波道输出而将屏蔽噪音度选定作为在基准信号中以及在测试信号中噪音度较大者。如果该波道输出低于相应的屏蔽级,则该波道输出接着会由屏蔽值所取代,因此避免了寄生失真的叠加,此因为这些被决定受到噪音不良影响的波道将在训练及测试的语音样本中具有相同的频谱值的缘故。然而,当两个将要进行比较的样本具有非常不同的噪声级,并且测试样本具有较高的噪音度之时,此方法将会造成具有较噪音为低的噪音度的所有基准样本噪声具有同等小的差异,因而使得这样的比较变得没有意义。
不同于上述的单纯机器语音辨识,人类对于语音的知觉就强健得多,其能够在不利的环境中达成相当高的辨识正确率。举例来说,在输入SNR低于20分贝的情况下,传统ASR系统的辨识正确率会大大的退化,然而人类却能够轻易地辨识甚至信号品质低到相当于0分贝SNR的语音。信号失真虽然扰人,但其却很少能够造成人类发生严重的语音辨识错误(除非在信号本身的振幅过低的情况下),并且每一个说话人的发音特征(至少针对本国说话人而言)并不会导致重大知觉问题的发生。因此,我们尝试发展一种类似于人类语音知觉的语音辨识系统。这种方法基本上能够分成两种类型:第一种类型建立出一种具人类听觉系统的机能的模型(例如耳膜以及耳蜗),但是这种系统会由于许多来自神经系统以及听觉单元间所产生的未知互动的许多反馈路径而将变得相当复杂,而使得这种尝试在理论上可行、然在实际运作上却受到相当的限制。第二种类型则利用人工神经网络(ANN)用以获取语音特点、用以处理动态与非线性语音信号、或者是用以与统计辨识器相组合。但是,人工神经系统具有繁重计算需求的缺点,使得具有相当大词汇的辨识系统变为不切实际。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于韦尔博泰克公司,未经韦尔博泰克公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/01124049.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种转基因克隆抗癌治癌技术
- 下一篇:一种形成闪存晶胞的方法





