[发明专利]语音识别及模型训练方法和装置在审
申请号: | 202210277532.4 | 申请日: | 2022-03-21 |
公开(公告)号: | CN114582323A | 公开(公告)日: | 2022-06-03 |
发明(设计)人: | 贾彦;汪俊杰 | 申请(专利权)人: | 联想(北京)有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/26 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 刘翠香 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 模型 训练 方法 装置 | ||
本申请公开了一种语音识别及模型训练方法和装置,该方法包括:获得待识别的语音信号;基于多种音频采集装置各自的第一音频分布特征,确定语音信号分别来源于多种音频采集装置的第一概率分布,音频采集装置的第一音频分布特征表征音频采集装置采集到的音频信号的音频分布特征;基于多种音频采集环境各自的第二音频分布特征,确定语音信号分别来源于多种音频采集环境的第二概率分布,音频采集环境的第二音频分布特征表征音频采集环境下采集到的音频信号具有的音频分布特征;结合语音信号的第一概率分布和第二概率分布中的至少一种,对语音信号进行唤醒词识别,得到唤醒词识别结果。本申请的方案可以提升唤醒词识别的准确性。
技术领域
本申请涉及数据处理技术领域,更具体地说,涉及一种语音识别及模型训练方法和装置。
背景技术
语音唤醒词识别也称为唤醒词检测,是指从语音信号中检测是否出现预定义的唤醒词。
随着电子设备的不断发展,不同电子设备上的音频采集装置的差异较大,使得不同电子设备的音频采集装置采集到的语音信号的差异性较大;而且,即使是同一电子设备,在不同环境下采集到的语音信号也会有较大差异。而由于语音信号采集设备和采集环境的差异性较大,使得语音唤醒词识别的难度较高,很容易出现唤醒词识别错误,导致唤醒词识别的识别性能较低。
发明内容
本申请提供了一种语音识别及模型训练方法和装置。
其中,一种语音识别方法,包括:
获得待识别的语音信号;
基于多种音频采集装置各自的第一音频分布特征,确定所述语音信号分别来源于所述多种音频采集装置的第一概率分布,所述音频采集装置的第一音频分布特征表征所述音频采集装置采集到的音频信号的音频分布特征;
基于多种音频采集环境各自的第二音频分布特征,确定所述语音信号分别来源于所述多种音频采集环境的第二概率分布,所述音频采集环境的第二音频分布特征表征所述音频采集环境下采集到的音频信号具有的音频分布特征;
结合所述语音信号的第一概率分布和第二概率分布中的至少一种,对所述语音信号进行唤醒词识别,得到唤醒词识别结果。
在一种可能的实现方式中,所述基于多种音频采集装置各自的第一音频分布特征,确定所述语音信号分别来源于所述多种音频采集装置的第一概率分布,包括:
基于所述多种音频采集装置各自的第一高斯混合模型,确定所述语音信号分别来源于所述多种音频采集装置的第一概率分布,所述音频采集装置的第一高斯混合模型为基于所述音频采集装置采集到的音频信号的音频特征构建出的高斯混合模型;
所述基于多种音频采集环境各自的第二音频分布特征,确定所述语音信号分别来源于所述多种音频采集环境的第二概率分布,包括:
基于多种音频采集环境各自的第二高斯混合模型,确定所述语音信号分别来源于所述多种音频采集环境的第二概率分布,所述音频采集环境的第二高斯混合模型为基于所述音频采集环境下采集到的音频信号的音频特征构建出的高斯混合模型。
在一种可能的实现方式中,所述结合所述语音信号的第一概率分布和第二概率分布中的至少一种,对所述语音信号进行唤醒词识别,得到唤醒词识别结果,包括:
将所述语音信号的第一概率分布和第二概率分布中的至少一种,以及所述语音信号输入到唤醒词识别模型,得到所述唤醒词识别模型输出的唤醒词识别结果;
其中,所述唤醒词识别模型为基于多个音频训练样本,以及所述音频训练样本的第一概率分布和第二概率分布中的至少一个进行有监督训练得到的,所述音频训练样本的第一概率分布为所述音频训练样本分别来源于所述多种音频采集装置的概率分布,所述音频训练样本的第二概率分布为所述音频训练样本分别来源于所述多种音频采集环境的概率分布。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210277532.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于互联网的园林绿化系统
- 下一篇:一种碗状结构施工工序