[发明专利]一种语音识别的方法、唤醒词检测的方法及装置有效

申请号：	201811253171.X	申请日：	2018-10-25
公开（公告）号：	CN109192210B	公开（公告）日：	2023-09-22
发明（设计）人：	高毅;陈杰;苏丹;于蒙;罗敏	申请（专利权）人：	腾讯科技（深圳）有限公司
主分类号：	G10L15/22	分类号：	G10L15/22;G10L15/197;G10L15/02
代理公司：	深圳市深佳知识产权代理事务所(普通合伙) 44285	代理人：	王仲凯
地址：	518057 广东省深圳***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种语音识别方法唤醒检测装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种语音识别的方法，其特征在于，包括：

获取满足叠词形式的待识别语音信息，其中，所述待识别语音信息中包含目标字集合，所述目标字集合由重复的至少两组目标词组成，每组目标词包括至少一个目标字；

根据所述待识别语音信息获取目标语音特征向量；

通过语音识别模型确定所述目标语音特征向量所对应的目标概率分值集合，其中，所述语音识别模型用于输出语音信息中每个字所对应的概率分值，所述目标概率分值集合包括每个目标字所对应的目标概率分值；所述语音识别模型包含的目标字的输出节点的数量，与所述每组目标词包括的目标字的数量相同；在所述语音识别模型中，一个目标字的输出节点用于输出同一目标字的至少两个目标概率分值；

若所述目标概率分值集合满足语音唤醒条件，则确定所述待识别语音信息包含目标唤醒词，其中，所述目标唤醒词属于唤醒词集合中的一个唤醒词；

获取所述目标唤醒词所对应的目标语音识别结果；

执行所述目标语音识别结果。

2.一种唤醒词检测的方法，其特征在于，包括：

根据所述待识别语音信息获取目标语音特征向量；

若所述目标概率分值集合满足语音唤醒条件，则确定所述待识别语音信息包含目标唤醒词，其中，所述目标唤醒词属于唤醒词集合中的一个唤醒词。

3.根据权利要求2所述的方法，其特征在于，所述待识别语音信息中还包括非目标字集合，所述非目标字集合包含至少一个非目标字；

所述根据所述待识别语音信息获取目标语音特征向量之后，所述方法还包括：

通过所述语音识别模型确定所述目标语音特征向量所对应的非目标概率分值，其中，所述非目标概率分值为所述非目标字集合的概率分值。

4.根据权利要求2所述的方法，其特征在于，所述获取满足叠词形式的待识别语音信息，包括：

从所述待识别语音信息中提取第一语音帧，其中，所述第一语音帧包括至少一个子语音帧；

所述根据所述待识别语音信息获取目标语音特征向量，包括：