[发明专利]语音信号识别方法、装置、电子设备和存储介质在审
申请号: | 202210334101.7 | 申请日: | 2022-03-30 |
公开(公告)号: | CN114898736A | 公开(公告)日: | 2022-08-12 |
发明(设计)人: | 梁玉权;王全东;吴俊楠;郭理勇;孔玉祥 | 申请(专利权)人: | 北京小米移动软件有限公司;北京小米松果电子有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/14;G10L15/22;G10L15/26;G10L21/0208;G10L21/0216 |
代理公司: | 北京法胜知识产权代理有限公司 11922 | 代理人: | 戎郑华 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 信号 识别 方法 装置 电子设备 存储 介质 | ||
1.一种语音信号识别方法,其特征在于,包括:
获取多个通道的第一语音信号;其中,各个通道的第一语音信号为设定时长内同步采集的原始语音信号;
将所述多个通道的第一语音信号输入训练得到的第一声学模型,得到对应的第一音素序列;
对所述第一音素序列进行识别得到语音内容。
2.如权利要求1所述的方法,其特征在于,对所述第一音素序列进行识别得到语音内容,包括:
对所述第一音素序列中连续的多个同一音素进行合并,得到第二音素序列;
对所述第二音素序列进行识别得到语音内容。
3.如权利要求2所述的方法,其特征在于,所述对第一音素序列中连续的多个同一音素进行合并,得到第二音素序列,包括:
根据所述第一音素序列中顺序排列的多个音素,确定至少一个音素组;所述音素组中包含相邻的多个同一音素;
将各个所述音素组中的同一音素合并,得到所述第二音素序列。
4.如权利要求1所述的方法,其特征在于,所述第一声学模型通过以下方式得到:
获取第一训练样本集;所述第一训练样本集中的各个第一训练样本包含多个通道的第二语音信号,各个通道的第二语音信号为设定时长内同步采集的原始样本语音信号;各个所述第一训练样本标注了对应的第三音素序列;
针对各个所述第一训练样本,将所述第一训练样本输入所述第一声学模型,得到所述第一训练样本对应的第四音素序列;
根据所述第四音素序列和标注的所述第三音素序列之间的差异,调整所述第一声学模型的参数。
5.如权利要求4所述的方法,其特征在于,所述获取第一训练样本集之前,包括:
获取多组所述多个通道的第二语音信号;
针对各组所述多个通道的第二语音信号,根据所述多个通道的第二语音信号进行语音信号处理,得到增强的单通道的第一目标语音信号;
将所述单通道的第一目标语音信号输入训练得到的第二声学模型,得到对应的第三音素序列;
根据多组所述多个通道的第二语音信号和对应的第三音素序列,生成所述第一训练样本集。
6.如权利要求5所述的方法,其特征在于,所述多个通道的第二语音信号是从声源通道和多个录音通道采样得到的,所述根据所述多个通道的第二语音信号进行语音信号处理,得到增强的单通道的第一目标语音信号,包括:
根据所述声源通道的第二语音信号,对所述各个录音通道的第二语音信号进行回声消除,得到回声消除的各个录音通道的第二语音信号;
根据所述回声消除的多个录音通道的第二语音信号进行波束成形,得到单通道第二语音信号;
对所述单通道第二语音信号,通过后置滤波器进行语音增强;
将所述增强的单通道第二语音信号进行傅里叶逆变换,得到所述单通道的第一目标语音信号。
7.如权利要求6所述的方法,其特征在于,所述根据所述声源通道的第二语音信号,对所述各个录音通道的第二语音信号进行回声消除,得到回声消除的各个录音通道的第二语音信号,包括:
确定所述声源通道的第二语音信号进行传递的声学传递函数;
根据所述声学传递函数对所述声源通道的第二语音信号进行回声估计,得到估计的回声信号;
根据各个所述录音通道的第二语音信号和所述回声信号,得到回声消除的各个录音通道的第二语音信号。
8.如权利要求5所述的方法,其特征在于,所述第二声学模型通过以下方式得到:
获取第二训练样本集;其中,所述第二训练样本集中包含多个第二训练样本,各个所述第二训练样本包含增强的单通道第二目标语音信号和对应的标准音素序列;所述增强的单通道第二目标语音信号是对多个通道的第三语音信号进行语音信号处理得到的,其中,各个通道的第三语音信号为设定时长内同步采集的原始语音信号;
针对各个所述第二训练样本,将所述第二训练样本输入所述第二声学模型,预测得到所述第二训练样本对应的第五音素序列;
根据所述第五音素序列的准确性,调整所述第二声学模型的参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小米移动软件有限公司;北京小米松果电子有限公司,未经北京小米移动软件有限公司;北京小米松果电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210334101.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种糖尿病前期患者心血管疾病风险的预测方法及系统
- 下一篇:一种新型保险盒