[发明专利]语音信号处理方法、装置、电子设备及存储介质在审
申请号: | 201910810339.0 | 申请日: | 2019-08-29 |
公开(公告)号: | CN112509570A | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 王阳阳;李曙光;韩伟 | 申请(专利权)人: | 北京猎户星空科技有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;G10L15/197;G10L15/18;G06F40/284;G06F40/30 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 郭晓丽 |
地址: | 100025 北京市朝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 信号 处理 方法 装置 电子设备 存储 介质 | ||
1.一种语音信号处理方法,其特征在于,包括:
对智能设备实时采集到的音频流数据进行语音识别,得到临时识别结果;
对所述临时识别结果进行分词处理,得到若干分词片段;
将所述若干分词片段组成的第一分词序列输入到已训练的断句模型中,根据所述断句模型的输出确定所述第一分词序列之后能够进行断句的第一预测概率;以及获取第二分词序列之后的下一个分词片段为结束字符的第二预测概率,所述第二预测概率为根据词频数据确定的,所述词频数据包括基于语料库中的语料确定出的各分词序列在各语料中出现的次数,所述第二分词序列为所述临时识别结果中最后的N个分词片段组成的序列,N为正整数;
根据所述第一预测概率和所述第二预测概率,确定第三预测概率;
若所述第三预测概率大于概率阈值,对所述临时识别结果进行语义解析。
2.根据权利要求1所述的方法,其特征在于,所述获取第二分词序列之后的下一个分词片段为结束字符的第二预测概率,具体包括:
从所述词频数据中获取所述第二分词序列对应的次数M;从所述词频数据中获取第三分词序列对应的次数K,所述第三分词序列为在所述第二分词序列之后增加所述结束字符得到的序列;根据所述K和所述M,确定所述第二预测概率;
或者,
从预先配置的各N元分词序列之后的下一个分词片段为结束字符的概率数据中,将所述第二分词序列对应的概率数据确定为第二预测概率,所述N元分词序列是基于所述语料库中的语料进行分词处理得到的,所述概率数据是根据所述N元分词序列对应的词频数据和在所述N元分词序列之后增加所述结束字符得到的N+1元分词序列对应的词频数据确定的。
3.根据权利要求1或2所述的方法,其特征在于,通过如下方式获取所述词频数据:
对所述语料库中的各语料进行分词处理,得到各语料对应的分词片段;
将每个语料中连续的N个分词片段组成的序列确定为一个N元分词序列;
将每个语料中连续的N+1个分词片段组成的序列确定为一个N+1元分词序列;
统计每个所述N元分词序列和每个所述N+1元分词序列在所述语料库的各语料中出现的次数,得到所述词频数据。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若所述第三预测概率小于或等于所述概率阈值,根据所述词频数据,确定所述第二分词序列之后出现概率最大的分词片段;
控制所述智能设备输出所确定的分词片段。
5.根据权利要求1或2或4所述的方法,其特征在于,
所述断句模型为二分类模型,所述二分类模型用于预测输入的分词序列之后的下一个分词片段是否为结束字符的概率,所述根据所述断句模型的输出确定所述第一分词序列之后能够进行断句的第一预测概率,具体包括:获取所述二分类模型输出的表征所述第一分词序列之后的下一个分词片段为结束字符的概率值,确定为所述第一预测概率;
或者,
所述断句模型为标点标注模型,所述标点标注模型用于预测输入的分词序列之后出现各标点符号的概率值,所述根据所述断句模型的输出确定所述第一分词序列之后能够进行断句的第一预测概率,具体包括:获取所述标点标注模型输出的所述第一分词序列之后出现指定标点符号的概率值,确定为所述第一预测概率。
6.根据权利要求5所述的方法,其特征在于,所述获取所述标点标注模型输出的所述第一分词序列之后出现指定标点符号的概率值,确定为所述第一预测概率,具体包括:
若获取到多个指定标点符号的概率值,将所述多个指定标点符号的概率值之和确定为所述第一预测概率,或者将所述多个指定标点符号的概率值中最大的概率值确定为所述第一预测概率。
7.根据权利要求5所述的方法,其特征在于,通过如下方式训练所述二分类模型:
获取多个语料样本以及每个语料样本的分类标注,所述分类标注用于标记所述语料样本之后是否为结束字符;
根据所述语料样本和所述语料样本的分类标注,对二分类模型进行训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京猎户星空科技有限公司,未经北京猎户星空科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910810339.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:衣物处理设备的流体测温装置及衣物处理设备
- 下一篇:空调床