[发明专利]一种语音解码方法及装置有效
申请号: | 202010128594.X | 申请日: | 2020-02-28 |
公开(公告)号: | CN111292725B | 公开(公告)日: | 2022-11-25 |
发明(设计)人: | 王磊;冯大航;陈孝良 | 申请(专利权)人: | 北京声智科技有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/02;G10L15/26 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王洋 |
地址: | 100080 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 解码 方法 装置 | ||
本申请提供了一种语音解码方法及装置,其中,所述方法包括:获取待解码语音,根据预设的帧移参数和跳帧参数,从多个音频帧中获得多个帧组合;其中,帧组合包括至少一个音频帧;对各个帧组合进行特征提取,得到各个帧组合的音频特征;将各个帧组合的音频特征分别输入完成训练的链模型,得到各个帧组合的语音解码结果,根据各个帧组合的语音解码结果,确定待解码语音的语音解码结果。由于本申请从多个音频帧中获取多个帧组合,使得待解码语音中较多的音频帧参与解码,得到的语音解码结果增多,因此,根据各个帧组合的语音解码结果,确定待解码语音的语音解码结果,得到的语音解码结果的解码精度得到提高。
技术领域
本申请涉及语音识别领域,尤其涉及一种语音解码方法及装置。
背景技术
语音解码是指将语音识别为汉字的过程,目前,通过对链模型(Chain model)进行训练,完成训练的链模型具有语音解码的功能。具体的,对于待解码语音,从该待解码语音中提取一个帧组合的音频特征,并将提取的音频特征输入完成训练的链模型,得到语音解码结果。
但是,语音解码的解码精度低,即得到的解码结果的准确性低。
发明内容
本申请提供了一种语音解码方法及装置,目的在于解决语音解码精度低的问题。
为了实现上述目的,本申请提供了以下技术方案:
本申请提供了一种语音解码方法,包括:
获取待解码语音;其中,所述待解码语音包括多个音频帧;
根据预设的帧移参数和跳帧参数,从所述多个音频帧中获得多个帧组合;其中,所述帧组合包括至少一个所述音频帧;
对各个所述帧组合进行特征提取,得到各个帧组合的音频特征;
将各个帧组合的音频特征分别输入完成训练的链模型,得到各个帧组合的语音解码结果;
根据各个帧组合的语音解码结果,确定所述待解码语音的语音解码结果。
可选的,所述根据各个帧组合的语音解码结果,确定所述待解码语音的语音解码结果,包括:
确定各个帧组合的语音解码结果的概率;
将概率最高的语音解码结果,作为所述待解码语音的语音解码结果。
可选的,所述方法还包括:
预训练所述链模型。
可选的,根据预设的帧移参数和跳帧参数,从所述多个音频帧中获得多个帧组合,包括:
根据所述预设的帧移参数和跳帧参数,计算帧组合中各个音频帧的帧序参数;
根据所述帧序参数,从所述多个音频帧中获得多个帧组合。
本申请还提供了一种语音解码装置,包括:
第一获取模块,用于获取待解码语音;其中,所述待解码语音包括多个音频帧;
第二获取模块,用于根据预设的帧移参数和跳帧参数,从所述多个音频帧中获得多个帧组合;其中,所述帧组合包括至少一个所述音频帧;
特征提取模块,用于对各个所述帧组合进行特征提取,得到各个帧组合的音频特征;
输入模块,用于将各个帧组合的音频特征分别输入完成训练的链模型,得到各个帧组合的语音解码结果;
确定模块,用于根据各个帧组合的语音解码结果,确定所述待解码语音的语音解码结果。
可选的,所述确定模块,用于根据各个帧组合的语音解码结果,确定所述待解码语音的语音解码结果,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京声智科技有限公司,未经北京声智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010128594.X/2.html,转载请声明来源钻瓜专利网。