[发明专利]语音交互方法、电子设备及可读存储介质在审
申请号: | 202110704213.2 | 申请日: | 2021-06-24 |
公开(公告)号: | CN113555016A | 公开(公告)日: | 2021-10-26 |
发明(设计)人: | 申俊伟;李魁峰 | 申请(专利权)人: | 北京房江湖科技有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/02;G10L15/06;G10L15/16;G10L15/18;G10L15/30;G10L17/18;G10L17/24;G10L25/24;G10L25/30 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 杨云云 |
地址: | 101309 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 交互 方法 电子设备 可读 存储 介质 | ||
1.一种语音交互方法,应用于终端,其特征在于,包括:
获取用户的语音输入,并提取所述语音输入的梅尔倒谱系数特征,并基于所述梅尔倒谱系数特征,计算所述语音输入每帧的置信度;
在基于所述置信度确定所述语音输入与预设唤醒词一致时,接收用户输入的语音服务指令,并将所述语音服务指令发送至服务器;
接收所述服务器基于所述语音服务指令识别并下发的用户的指令意图;
将所述指令意图转换为待执行指令,并基于所述待执行指令,执行对应的服务流程。
2.根据权利要求1所述的语音交互方法,其特征在于,在基于所述置信度确定所述语音输入与所述预设唤醒词一致时,所述方法还包括:
弹出语音输入引导浮层,所述语音输入引导浮层用于引导用户输入所述语音服务指令。
3.根据权利要求2所述的语音交互方法,其特征在于,所述弹出语音输入引导浮层,包括:
对所述语音输入进行第一预设数据处理,提取所述语音输入的梅尔倒谱系数特征;
基于所述梅尔倒谱系数特征,利用目标全连接深度神经网络模型,计算所述语音输入每帧的置信度;
通过比较所述置信度与预设的唤醒阈值,判断所述语音输入与所述预设唤醒词是否一致,若一致,则弹出所述语音输入引导浮层。
4.根据权利要求3所述的语音交互方法,其特征在于,所述计算所述语音输入每帧的置信度,包括:
基于所述梅尔倒谱系数特征,利用目标全连接深度神经网络模型,计算所述语音输入每帧的标签后验概率;
计算所述标签后验概率的平滑度,获取平滑后的标签后验概率,并基于所述平滑后的标签后验概率,计算所述语音输入中每帧的置信度。
5.根据权利要求1-4中任一所述的语音交互方法,其特征在于,所述基于所述待执行指令,执行对应的服务流程,包括:
基于所述待执行指令向所述服务端请求目标服务;
接收所述服务端通过服务注册方式处理所述待执行指令获取并下发的目标服务的结果,并将所述目标服务的结果进行展示。
6.一种语音交互方法,应用于服务器,其特征在于,包括:
接收终端在根据用户的语音输入的梅尔倒谱系数特征计算所述语音输入每帧的置信度以进行唤醒词的一致性校验后发送的用户的语音服务指令,并采用基于RNN+CTC的声学模型,对所述语音服务指令进行语音识别,获取所述语音服务指令对应的文本指令;
基于所述文本指令,获取用户的指令意图,并将所述指令意图发送给所述终端;
接收所述终端基于所述指令意图发送的待执行指令,并基于所述待执行指令,执行对应的服务流程。
7.根据权利要求6所述的语音交互方法,其特征在于,所述对所述语音服务指令进行语音识别,包括:
对所述语音服务指令进行数据预处理,获取有效语音信息;
利用基于Kaldi语音识别工具的目标语言模型以及RNN+CTC声学模型,将所述有效语音信息转换为对应的文本信息,作为所述文本指令;
其中,所述目标语言模型和所述RNN+CTC声学模型为预先通过标注设定数量的目标行业领域的语音数据构建训练样本,并利用所述训练样本进行循环迭代训练获取的;
或者,
所述基于所述待执行指令,执行对应的服务流程,包括:
接收所述终端基于所述待执行指令发送的服务请求,所述服务请求用于向所述服务端请求目标服务;
通过服务注册方式检索所述待执行指令关联的目标服务,并基于所述目标服务处理所述待执行指令,获取目标服务的结果;
将所述目标服务的结果发送给所述终端。
8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的程序或指令,其特征在于,所述处理器执行所述程序或指令时,实现如权利要求1至7中任一项所述的语音交互方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京房江湖科技有限公司,未经北京房江湖科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110704213.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于搅拌车的控制装置及搅拌车
- 下一篇:一种用于时间投影电离室的场笼