[发明专利]一种语音识别方法、装置及设备有效
申请号: | 201910001000.6 | 申请日: | 2019-01-02 |
公开(公告)号: | CN111402870B | 公开(公告)日: | 2023-08-15 |
发明(设计)人: | 侯雷静 | 申请(专利权)人: | 中国移动通信有限公司研究院;中国移动通信集团有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/06;G10L15/26;G10L25/30 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 许静;安利霞 |
地址: | 100053 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 方法 装置 设备 | ||
1.一种语音识别方法,其特征在于,包括:
利用预设声学特征映射模型对待识别的语音信息进行映射,得到目标语音信息;
将所述目标语音信息识别转换为对应的文本信息;
其中,所述目标语音信息的信号特征与预设信号特征之间相匹配;
利用预设声学特征映射模型对待识别的语音信息进行映射,得到目标语音信息之前,还包括:
采用对抗式深度神经网络训练所述预设声学特征映射模型;
所述采用对抗式深度神经网络训练所述预设声学特征映射模型,包括:
利用公式一,训练所述预设声学特征映射模型,得到所述预设声学特征映射模型的目标参数配置信息;
其中,所述预设声学特征映射模型对应的损失函数包括对经过所述预设声学特征映射模型后的语音信息进行解码输出产生的第一损失函数和对经过所述预设声学特征映射模型后的语音信息进行地域分类产生的第二损失函数;
所述公式一为:F(Loss)=F(L1)-λF(L2);
F(Loss)表示总损失值;F(L1)表示所述第一损失函数;λ表示预设调节系数;F(L2)表示所述第二损失函数。
2.根据权利要求1所述的语音识别方法,其特征在于,所述利用预设声学特征映射模型对待识别的语音信息进行映射,得到目标语音信息,包括:
利用预设声学特征映射模型中的卷积层对待识别的语音信息进行卷积操作,得到第一语音信息;
利用预设声学特征映射模型中的池化层对所述第一语音信息进行平均池化操作,得到第二语音信息;
利用预设声学特征映射模型中的网络层对所述第二语音信息进行映射操作,得到目标语音信息。
3.根据权利要求2所述的语音识别方法,其特征在于,所述卷积层的网络为卷积神经网络,所述网络层的激活函数为线性整流函数Relu。
4.根据权利要求1所述的语音识别方法,其特征在于,所述预设声学特征映射模型的目标参数配置信息为:所述公式一中的F(Loss)取最小值时,所述预设声学特征映射模型的参数配置信息。
5.一种语音识别装置,其特征在于,包括:
第一映射模块,用于利用预设声学特征映射模型对待识别的语音信息进行映射,得到目标语音信息;
第一转换模块,用于将所述目标语音信息识别转换为对应的文本信息;
其中,所述目标语音信息的信号特征与预设信号特征之间相匹配;
第一训练模块,用于利用预设声学特征映射模型对待识别的语音信息进行映射,得到目标语音信息之前,采用对抗式深度神经网络训练所述预设声学特征映射模型;
所述第一训练模块,包括:
第一训练子模块,用于利用公式一,训练所述预设声学特征映射模型,得到所述预设声学特征映射模型的目标参数配置信息;
其中,所述预设声学特征映射模型对应的损失函数包括对经过所述预设声学特征映射模型后的语音信息进行解码输出产生的第一损失函数和对经过所述预设声学特征映射模型后的语音信息进行地域分类产生的第二损失函数;
所述公式一为:F(Loss)=F(L1)-λF(L2);
F(Loss)表示总损失值;F(L1)表示所述第一损失函数;λ表示预设调节系数;F(L2)表示所述第二损失函数。
6.根据权利要求5所述的语音识别装置,其特征在于,所述第一映射模块,包括:
第一处理子模块,用于利用预设声学特征映射模型中的卷积层对待识别的语音信息进行卷积操作,得到第一语音信息;
第二处理子模块,用于利用预设声学特征映射模型中的池化层对所述第一语音信息进行平均池化操作,得到第二语音信息;
第三处理子模块,用于利用预设声学特征映射模型中的网络层对所述第二语音信息进行映射操作,得到目标语音信息。
7.根据权利要求6所述的语音识别装置,其特征在于,所述卷积层的网络为卷积神经网络,所述网络层的激活函数为线性整流函数Relu。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信有限公司研究院;中国移动通信集团有限公司,未经中国移动通信有限公司研究院;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910001000.6/1.html,转载请声明来源钻瓜专利网。