[发明专利]基于自然语言处理的语音识别方法、装置、设备及介质在审
申请号: | 202110467540.0 | 申请日: | 2021-04-28 |
公开(公告)号: | CN113192497A | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | 康海梅;魏韬;马骏;王少军 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L15/18 | 分类号: | G10L15/18;G10L15/26;G10L15/02 |
代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 涂年影 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 自然语言 处理 语音 识别 方法 装置 设备 介质 | ||
1.一种基于自然语言处理的语音识别方法,其特征在于,所述方法包括:
若接收到用户输入的语音信息,根据预置的音频特征提取模型从所述语音信息中提取得到音频特征信息;
根据预置的困惑网络对所述音频特征信息进行解析得到拼音信息及初始文本信息;
根据预置的转换词典分别对所述拼音信息及所述初始文本信息进行转换得到对应的拼音编码序列及初始字符编码序列;
对所述拼音编码序列及所述初始字符编码序列进行叠加组合得到所述语音信息的组合编码序列;
将所述组合编码序列输入预置的文本纠错模型进行纠错以得到对应的纠错编码序列;
根据所述转换词典对所述纠错编码序列进行逆转换得到与所述语音信息对应的文本识别信息。
2.根据权利要求1所述的基于自然语言处理的语音识别方法,其特征在于,所述音频特征提取模型包括频谱转换规则、频率转换公式及逆变换规则,所述根据预置的音频特征提取模型从所述语音信息中提取得到音频特征信息,包括:
对所述语音信息进行分帧处理得到对应的多帧音频信息;
根据预置的单位时间及所述频谱转换规则将每一所述单位时间内包含的所述音频信息转换为对应的音频频谱;
根据所述频率转换公式将每一所述音频频谱转换为对应的非线性音频频谱;
根据所述逆变换规则对每一所述非线性音频频谱进行逆变换得到与每一所述非线性音频频谱对应的多个音频系数作为所述音频特征信息。
3.根据权利要求1所述的基于自然语言处理的语音识别方法,其特征在于,所述根据预置的困惑网络对所述音频特征信息进行解析得到拼音信息及初始文本信息,包括:
根据所述困惑网络中标准拼音信息与标准音频特征信息的对应关系,获取与所述音频特征信息相匹配的一条拼音信息;
根据所述困惑网络中标准拼音信息与字符之间的关联关系,获取所述困惑网络中与所述拼音信息对应的字符串联形成的多条可选文本信息;
计算所述困惑网络中每一所述可选文本信息的路径相似度,并从所述多条可选文本信息中获取路径相似度最高的一条可选文本信息作为初始文本信息。
4.根据权利要求1所述的基于自然语言处理的语音识别方法,其特征在于,所述对所述拼音编码序列及所述初始字符编码序列进行叠加组合得到所述语音信息的组合编码序列,包括:
将所述拼音编码序列中每一个拼音编码值与所述字符编码序列中对应的一个字符编码值进行相加,得到对应的第一编码序列;
将所述拼音编码序列中每一个拼音编码值与所述字符编码序列中对应的一个字符编码值进行顺序拼接,得到对应的第二编码序列;
将所述第一编码序列与所述第二编码序列进行组合作为对应的组合编码序列。
5.根据权利要求1所述的基于自然语言处理的语音识别方法,其特征在于,所述根据预置的困惑网络对所述音频特征信息进行解析得到拼音信息及初始文本信息之前,还包括:
根据所述音频特征提取模型分别从预存的标准数据集合包含的标准语音信息中提取得到对应的标准音频特征信息;
从所述标准音频特征信息中获取所述标准数据集合的标准拼音信息中与每一字符拼音对应的标准音频特征;
根据所述标准数据集合中的标准文本信息及所述标准音频特征与每一所述字符拼音之间的关联关系构建得到所述困惑网络。
6.根据权利要求5所述的基于自然语言处理的语音识别方法,其特征在于,所述将所述组合编码序列输入预置的文本纠错模型进行纠错以得到对应的纠错编码序列之前,还包括:
根据所述音频特征提取模型分别从预存的训练数据集合包含的训练语音信息中提取得到对应的训练音频特征信息;
根据所述困惑网络对所述训练音频特征信息进行解析以获取训练拼音信息及训练预测文本信息;
将所述训练拼音信息及训练预测文本信息与所述训练数据集合中对应的训练文本信息进行组合,得到模型训练数据集合;
根据所述模型训练数据集合对初始文本纠错模型进行迭代训练,得到训练后的文本纠错模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110467540.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种改性聚羧酸减水剂及其制备方法
- 下一篇:远程监控智能投球装置