[发明专利]语音识别系统、方法、装置及设备在审
申请号: | 202110594047.5 | 申请日: | 2021-05-28 |
公开(公告)号: | CN115410573A | 公开(公告)日: | 2022-11-29 |
发明(设计)人: | 赵英竹;倪崇嘉;梁祥智;查缇沙菲克;荘永祥;马斌 | 申请(专利权)人: | 阿里巴巴新加坡控股有限公司;南洋理工大学 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/06;G10L15/02 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 钱秀茹 |
地址: | 新加坡珊顿道*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 系统 方法 装置 设备 | ||
本申请公开了语音识别系统、方法、装置及设备。其中,所述方法包括:从训练样本中学习得到语音识别模型,所述训练样本中的语音转换文本包括句子非结尾词,在训练所述模型时,调整语音识别模型的训练损失值对句子结尾词的第一梯度,以降低语音识别模型对句子结尾词的产生概率;通过语音识别模型,确定语音数据的语音转换文本。采用这种处理方式,使得调整语音识别模型训练损失的梯度,这种缩放梯度方式可降低句子结尾词的产生概率,一定程度上削弱了模型学习产生句子结尾词的能力,这样可鼓励模型学习不断生成非句子结尾词,实现无需标注句子真实终点,即可避免早产生句子终点;因此,可以有效提升语音识别性能。
技术领域
本申请涉及语音处理技术领域,具体涉及语音识别系统、方法和装置,语音识别模型处理方法和装置,会议记录生成系统,语音交互系统,以及电子设备。
背景技术
语音识别是将语音转换为文字的技术。在线语音识别(实时语音识别)可将实时采集的语音快速准确识别为文字。随着端到端技术在语音识别中的应用,实时语音识别得到了更多的关注。
实时语音识别存在早终点问题,即预测的句子终点早于用户停止说话的时间。解决该问题的传统方式是,通过语音活性检测(Voice activity detection,VAD),探测语音信号中长时间的空白,以此作为说话的终点。但是,长时间的空白并不直接与结束说话相关,这也受到说话人节奏的影响,而且这种传统方法忽略了一些暗示说话结束的语音信号,如语气词等。为了更好的解决早终点问题,目前主要采用模型预测方式进行处理。例如,训练模型可识别早/中/晚的空白,将晚空白作为句子的终点。再例如,在准备训练数据时,可标注句子的真实终点,标注数据需包括句子结尾词对应的时间信息;在训练模型时,以句子的真实终点作为标准,惩罚过早或过晚结束的情况。
然而,在实现本发明过程中,发明人发现上述基于预先标注的句子真实终点数据进行模型学习的处理方式,虽然可以较好地解决语音识别中存在的早终点问题,但是需要预先标注句子真实的终点,如采用人工标注方式等,这样就会出现早终点问题的解决受限于句子真实终点标注数据的准确性,如果句子真实终点标注数据的准确率较低,则仍无法较好地解决语音识别中的早终点问题。
发明内容
本申请提供语音识别系统,以解决现有技术存在的语音识别中早终点问题的解决效果受限于句子真实终点标注数据的准确性的问题。本申请另外提供语音识别模型处理方法和装置,语音识别方法和装置,会议记录生成系统,语音交互系统,以及电子设备。
本申请提供一种语音识别系统,包括:
语音采集模块,用于采集语音数据,发送所述语音数据;
语音识别模块,用于确定语音识别模型的训练样本,所述训练样本中的语音转换文本包括句子非结尾词;调整语音识别模型的训练损失值对句子结尾词的第一梯度,以降低语音识别模型对句子结尾词的产生概率;根据调整的梯度,从训练样本中学习得到语音识别模型;以及,接收所述语音数据,通过语音识别模型,确定所述语音数据的转写文本。
本申请还提供一种语音识别模型处理方法,包括:
确定语音识别模型的训练样本,所述训练样本中的语音转换文本包括句子非结尾词;
调整语音识别模型的训练损失值对句子结尾词的第一梯度,以降低语音识别模型对句子结尾词的产生概率;
根据调整的梯度,从训练样本中学习得到语音识别模型。
可选的,所述语音识别模型的损失函数包括词的产生概率项;
所述语音识别模型的梯度函数包括词的产生概率项与梯度缩放尺度项的乘积;
所述调整语音识别模型的训练损失值对句子结尾词的第一梯度,包括:
将第一梯度的梯度缩放尺度项设置为大于1的第一参数值。
可选的,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴新加坡控股有限公司;南洋理工大学,未经阿里巴巴新加坡控股有限公司;南洋理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110594047.5/2.html,转载请声明来源钻瓜专利网。