[发明专利]语音识别系统、方法、装置及设备在审
申请号: | 202110594047.5 | 申请日: | 2021-05-28 |
公开(公告)号: | CN115410573A | 公开(公告)日: | 2022-11-29 |
发明(设计)人: | 赵英竹;倪崇嘉;梁祥智;查缇沙菲克;荘永祥;马斌 | 申请(专利权)人: | 阿里巴巴新加坡控股有限公司;南洋理工大学 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/06;G10L15/02 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 钱秀茹 |
地址: | 新加坡珊顿道*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 系统 方法 装置 设备 | ||
1.一种语音识别系统,其特征在于,包括:
语音采集模块,用于采集语音数据,发送所述语音数据;
语音识别模块,用于确定语音识别模型的训练样本,所述训练样本中的语音转换文本包括句子非结尾词;调整语音识别模型的训练损失值对句子结尾词的第一梯度,以降低语音识别模型对句子结尾词的产生概率;根据调整的梯度,从训练样本中学习得到语音识别模型;以及,接收所述语音数据,通过语音识别模型,确定所述语音数据的转写文本。
2.一种语音识别模型处理方法,其特征在于,包括:
确定语音识别模型的训练样本,所述训练样本中的语音转换文本包括句子非结尾词;
调整语音识别模型的训练损失值对句子结尾词的第一梯度,以降低语音识别模型对句子结尾词的产生概率;
根据调整的梯度,从训练样本中学习得到语音识别模型。
3.根据权利要求2的方法,其特征在于,
所述语音识别模型的损失函数包括词的产生概率项;
所述语音识别模型的梯度函数包括词的产生概率项与梯度缩放尺度项的乘积;
所述调整语音识别模型的训练损失值对句子结尾词的第一梯度,包括:
将第一梯度的梯度缩放尺度项设置为大于1的第一参数值。
4.根据权利要求3的方法,其特征在于,还包括:
调整语音识别模型的训练损失值对句子非结尾词的第二梯度,以提升语音识别模型对句子非结尾词的产生概率;
所述调整语音识别模型的训练损失值对句子非结尾词的第二梯度,包括:
将第二梯度的梯度缩放尺度项设置为大于0且小于1的第二参数值。
5.一种语音识别方法,其特征在于,包括:
从训练样本中学习得到语音识别模型,所述训练样本中的语音转换文本包括句子非结尾词,在训练所述模型时,调整语音识别模型的训练损失值对句子结尾词的第一梯度,以降低语音识别模型对句子结尾词的产生概率;
接收待识别的语音数据;
通过语音识别模型,确定所述语音数据的语音转换文本。
6.一种语音识别方法,其特征在于,包括:
采集语音数据;
向服务端发送语音数据,以使得服务端采用如下方式处理所述语音数据:
从训练样本中学习得到语音识别模型,所述训练样本中的语音转换文本包括句子非结尾词,在训练所述模型时,调整语音识别模型的训练损失值对句子结尾词的第一梯度,以降低语音识别模型对句子结尾词的产生概率;通过语音识别模型,确定所述语音数据的语音转换文本。
7.一种语音语音识别模型处理装置,其特征在于,包括:
训练数据确定单元,用于确定语音识别模型的训练样本,所述训练样本中的语音转换文本包括句子非结尾词;
梯度缩放单元,用于调整语音识别模型的训练损失值对句子结尾词的第一梯度,以降低语音识别模型对句子结尾词的产生概率;
模型训练单元,用于根据调整的梯度,从训练样本中学习得到语音识别模型。
8.一种电子设备,其特征在于,包括:
处理器和存储器;
存储器,用于存储实现根据权利要求2-6所述的方法的程序,该设备通电并通过所述处理器运行该方法的程序。
9.一种会议记录生成系统,其特征在于,包括:
客户端,用于采集会议语音数据,发送所述语音数据;
服务端,用于确定语音识别模型的训练样本,所述训练样本中的语音转换文本包括句子非结尾词;调整语音识别模型的训练损失值对句子结尾词的第一梯度,以降低语音识别模型对句子结尾词的产生概率;根据调整的梯度,从训练样本中学习得到语音识别模型;以及,接收所述语音数据,通过语音识别模型,确定会议记录。
10.一种语音交互系统,其特征在于,包括:
智能音箱,用于采集目标用户的语音数据,发送所述语音数据;
服务端,用于确定语音识别模型的训练样本,所述训练样本中的语音转换文本包括句子非结尾词;调整语音识别模型的训练损失值对句子结尾词的第一梯度,以降低语音识别模型对句子结尾词的产生概率;根据调整的梯度,从训练样本中学习得到语音识别模型;以及,接收所述语音数据,通过语音识别模型,确定所述语音数据的转写文本;根据所述语音数据的转写文本,执行语音交互处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴新加坡控股有限公司;南洋理工大学,未经阿里巴巴新加坡控股有限公司;南洋理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110594047.5/1.html,转载请声明来源钻瓜专利网。