[发明专利]一种复杂环境下语音特征映射方法有效
申请号: | 201710151497.0 | 申请日: | 2017-03-14 |
公开(公告)号: | CN106782520B | 公开(公告)日: | 2019-11-26 |
发明(设计)人: | 王志锋;郭天学;左明章;田元;姚璜 | 申请(专利权)人: | 华中师范大学 |
主分类号: | G10L15/20 | 分类号: | G10L15/20;G10L15/02;G10L15/14;G10L17/02;G10L17/06 |
代理公司: | 42222 武汉科皓知识产权代理事务所(特殊普通合伙) | 代理人: | 魏波<国际申请>=<国际公布>=<进入国 |
地址: | 430079 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 复杂 环境 语音 特征 映射 方法 | ||
本发明提供了一种复杂环境下语音特征映射方法,首先提取干净环境下的语音信号的特征;然后提取复杂环境下的语音信号的特征;接着利用特征映射方法对复杂环境下的语音信号进行特征映射,使得到的映射特征可近似视为干净环境下的语音信号特征;最后与已经训练完毕的干净环境下的语音信号模型进行模式匹配和识别。本发明利用特征映射函数对复杂环境下的语音信号进行映射,使得到的特征可以近似视为干净环境下的语音信号特征,通过映射函数的作用可使复杂环境下的语音特征的纯净度得到大幅度提升从而提升语音识别的准确度,提高语音识别系统的鲁棒性。
技术领域
本发明属于语音信号处理技术领域,特别涉及一种复杂环境下语音特征映射方法。
技术背景
随着计算机技术的深入发展,模式识别已经成为一种为人类带来巨大便利的实用技术,特别是在人机交互领域。模式识别能够为人机交互提供新的方式,为用户带来更加自然和更有沉浸感的交互体验。而语音识别是模式识别中非常重要的一个模块,在人类自然的交互中,语音交流是最为重要的一种方式,语音识别的运用使得人能够以自然的交互方式与机器进行交互,这种交互方式的便利性可大大缓解人类在人机交互中的压力,丰富了人与机器交互的方式,也使得人机交互更加的丰富和多样。近几十年语音识别已经发展的足够完美,识别率也足够高,然而这些结果都是在实验室内得出的结果,也就是说,在干净环境下,语音识别的结果是足够好的。但是在现实生活中,环境的复杂度是无法估量的,人们几乎不可能保证所身处的环境都是干净的环境,人们的周边充斥着噪音,这些噪音可能是周围自然环境所发出的噪声,也可能是其他人所发出的噪声,也可能是录音设备的噪声。也就是说,语音识别在自然的应用中是处于被噪声包围的复杂环境下的,而语音识别亟需解决的痛点就是在复杂环境下的识别率并不高,甚至是其结果是不被人们所接受的。
语音识别的结果受到周围环境的影响,在实验室环境(即干净环境下)其结果足够好,但是在现实环境(即复杂环境)中其结果是不被人们所接受的。这是亟需解决的问题。语音识别的过程包括模型训练和识别两个过程,而模型训练一般使用的都是干净环境下的语音信号,识别过程使用的是复杂环境下即真实的语音信号。要解决这个问题就需要从如何使复杂环境下的语音信号与干净环境下的语音信号进行匹配入手。在语音信号的处理过程中,有两个非常重要的环节,特征提取和建立模型,当今的解决方案大致便可以分为两种,一种是从特征入手,另一种是从模型入手。
特征映射就是从特征入手的一种解决方案。通过特征映射函数的作用,将复杂环境下的语音信号特征转换成可以近似视为干净环境下的语音信号特征。可大大提高现实应用中语音识别的准确率,提高语音识别系统的鲁棒性。
发明内容
本发明的目的在于提出一种通过特征映射来提高复杂环境下语音识别系统的鲁棒性的方法,该方法通过对复杂环境下的语音特征进行映射,使得复杂环境下的语音特征通过映射函数映射得到的语音特征具有近似干净环境下语音特征的纯净度,从而来提高语音识别系统在复杂环境下的识别率。
本发明所采用的技术方案是:一种复杂环境下语音特征映射方法,其特征在于,包括以下步骤:
步骤1:提取干净环境下的语音信号的特征;
步骤2:对复杂环境下的语音进行特征提取;
步骤3:利用特征映射方法对复杂环境下的语音特征进行映射;
步骤4:模式匹配与识别。
本发明具有以下优点和有益效果:
(1)本发明中提出的特征映射方法是一种线性的映射方法,计算简便且计算值为精确值,能够提高参数的精度;
(2)本发明提出的映射方法通过对复杂环境下的语音特征进行映射,能提高语音识别系统的识别准确率,具有较强的鲁棒性;
(3)本发明提出的映射方法还可以对干净环境下的语音进行映射,依然可以取得同样的效果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中师范大学,未经华中师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710151497.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于置信度的语音识别实现方法及系统
- 下一篇:一种语音识别系统