[发明专利]语音识别方法、系统、装置及介质有效

专利信息
申请号: 202110470132.0 申请日: 2021-04-28
公开(公告)号: CN113299283B 公开(公告)日: 2023-03-10
发明(设计)人: 白蒙蒙 申请(专利权)人: 上海淇玥信息技术有限公司
主分类号: G10L15/14 分类号: G10L15/14;G10L15/26;G10L15/18
代理公司: 北京清诚知识产权代理有限公司 11691 代理人: 喻颖
地址: 201500 上海市崇明*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语音 识别 方法 系统 装置 介质
【权利要求书】:

1.一种语音识别方法,其特征在于,包括:

根据语音识别服务请求,获得待识别语音的声学特征以及对应所述声学特征的领域信息,具体包括:在一次服务请求中,将所述待识别语音转换为声学模型对应的单元以构建当前一句话的语料作为所述声学特征;通过训练后的语料领域分类器根据语料的领域分类,判断所述当前一句话的语料所属的领域,作为对应所述声学特征的所述领域信息;其中,所述语料领域分类器的训练具体包括:

构建训练语料领域分类器的训练数据,包括:在各个领域中将语料构成若干个对话、随机选取多个不同领域中的所述若干个对话拼接在一起形成一个训练样本,将每一个训练样本中的所有语料转换为声学模型对应的单元以作为语料分类器的输入、将每一个训练样本中的所有语料的文本作为语料分类器的输出、并且对每一个训练样本中每一个不同领域的衔接点进行变化标注;以及,利用所述训练语料领域分类器的训练数据训练预先构建的所述语料领域分类器;

基于深度学习的动态语言模型切换到所述领域信息对应的领域对所述声学特征进行识别,以确定所述待识别语音对应的文本识别结果,具体包括:基于深度学习的动态语言模型包括构建采用嵌入层Embedding来代表各个领域对应的各个语言模型结构的神经网络模型;以及,将所述领域信息转化后进行特征编码、并将所述特征编码与从所述声学特征中提取的特征进行融合、基于深度学习的动态语言模型根据融合的特征切换到与所述特征编码指示的领域相对应的语言算法并对融合的特征进行特征解码,以获得预测的所述待识别语音对应的文本识别结果。

2.如权利要求1所述的方法,其特征在于,所述语音识别服务请求包括:长对话识别的一次服务请求,和/或,单句识别的一次服务请求。

3.如权利要求2所述的方法,其特征在于,通过训练后的语料领域分类器根据语料的领域分类,判断所述当前一句话的语料所属的领域,作为对应所述声学特征的所述领域信息,具体还包括:

当所述语音识别服务请求为单句识别的一次服务请求时,直接根据语料的领域分类,判断所述当前一句话的语料所属的领域;

当所述语音识别服务请求为长对话识别的一次服务请求时,先根据上一句话的识别信息对所述当前一句话的语料的第一特征进行提取,融合所述第一特征与从所述当前一句话的语料直接提取的特征后,再根据语料的领域分类,判断所述当前一句话的语料所属的领域;其中,上一句话指所述当前一句话之前的一句话。

4.如权利要求3所述的方法,其特征在于,

所述语料的领域分类包括:设定各个领域中的语料所对应的标签,标识语料的领域分类;

和/或,

所述上一句话的识别信息包括:已经发生并识别过的所述上一句话的状态向量。

5.如权利要求4所述的方法,其特征在于,

利用训练所述语料领域分类器的训练数据训练预先构建的所述语料领域分类器,具体包括:

根据当前t时刻的状态对所述输入进行第一特征提取,并计算用于判断语料领域是否变化部分的损失函数;其中,所述当前t时刻的状态为t-1时刻返回的状态向量,其表示已发生并识别的t-1时刻的一句话的状态向量;对所述输入进行特征提取,并且融合所述第一特征,以及计算用于判断所述输入中的语料所属的领域部分的损失函数;

确定是否达到预定训练次数和/或是否各个所述损失函数达到收敛目标,如果是,则结束所述语料领域分类器的训练。

6.如权利要求1至5任一项所述的方法,其特征在于,还包括构建训练所述动态语言模型的训练数据,具体包括:

随机选取各个领域中的每一句语料,并将每一句语料作为一个训练样本;

将每一个训练样本中的所有语料转换为声学模型对应的单元以作为所述动态语言模型的输入,将每一个训练样本中的所有语料的文本作为所述动态语言模型的输出,并且,标注每一个训练样本的语料所属的领域。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海淇玥信息技术有限公司,未经上海淇玥信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110470132.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top