[发明专利]语音控制方法及装置在审
申请号: | 202110262462.0 | 申请日: | 2021-03-10 |
公开(公告)号: | CN115083401A | 公开(公告)日: | 2022-09-20 |
发明(设计)人: | 冉茂松;张晓帆;曾理;钟卫东;王佩玲 | 申请(专利权)人: | OPPO广东移动通信有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强 |
地址: | 523860 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 控制 方法 装置 | ||
1.一种语音控制方法,其特征在于,应用于仲裁设备,所述方法包括:
接收目标用户的语音数据,所述语音数据包括语音操控指令,所述语音操控指令用于指示电子设备执行操作命令;
判断所述语音数据中是否包括目标设备的名称;
在所述语音数据中包括所述目标设备的名称时,将所述语音操控指令转换成设备控制指令;否则,根据所述语音数据获取目标用户的身份信息,根据所述身份信息调用语义推理模型确定目标设备;
向所述目标设备发送所述设备控制指令。
2.根据权利要求1所述的方法,其特征在于,所述身份信息包括注册用户和未注册用户;
所述根据所述语音数据获取目标用户的身份信息,包括:
提取所述语音数据对应的声纹特征信息;
将所述声纹特征信息与预存储的至少一个声纹特征信息分别进行匹配;
若所述声纹特征信息与预存储的目标声纹特征信息匹配,将所述目标用户的身份信息确定为所述注册用户,所述目标声纹特征信息为所述至少一个声纹特征信息中的任一声纹特征信息;
若所述声纹特征信息与所有预存储的声纹特征信息均不匹配,将所述目标用户的身份信息确定为所述未注册用户。
3.根据权利要求2所述的方法,其特征在于,所述语义推理模型包括第一语义推理模型和第二语义推理模型,所述第一语义推理模型为将所述注册用户语料作为训练样本训练得到的,所述第二语义推理模型为将通用语料作为训练样本训练得到的;
所述根据所述身份信息调用语义推理模型确定目标设备,包括:
若所述用户身份为所述注册用户,将所述语音操控指令输入所述第一语义推理模型,得到所述目标设备;
若所述用户身份为所述未注册用户,将所述语音操控指令输入所述第二语义推理模型,得到所述目标设备。
4.根据权利要求3所述的方法,其特征在于,所述第一语义推理模型的训练方法包括:
获取训练数据集,所述训练数据集包括所述注册用户的多条语音数据;
对所述多条语音数据执行特征提取操作,得到多个音频特征;
将所述多个音频特征输入待训练第一语义推理模型进行训练,直至达到训练结束条件,得到所述第一语义推理模型。
5.根据权利要求3所述的方法,其特征在于,所述获取训练数据集,包括:
根据所述声纹特征信息与注册用户之间的映射关系,确定目标声纹特征信息所对应的目标注册用户;
获取多条原始语音数据,所述原始语音数据包括所述目标注册用户的语音操控指令;
确定执行所述目标注册用户的语音操控指令的执行设备;
将所述执行设备标注为所述语音操控指令的所述目标设备,得到所述多条语音数据。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述将所述多个音频特征输入待训练第一语义推理模型进行训练,直至达到训练结束条件,得到所述第一语义推理模型,包括:
将所述多个音频特征输入待训练第一语义推理模型,得到每条语音数据对应的输出设备;
依据所述输出设备和标注的目标设备构建损失函数;
将所述损失函数最小化所对应的参数更新为所述待训练第一语义推理模型的参数,得到所述第一语义推理模型。
7.一种语音控制装置,其特征在于,应用于仲裁设备,所述装置包括:
收发单元,用于接收目标用户的语音数据,所述语音数据包括语音操控指令,所述语音操控指令用于指示电子设备执行操作命令;
处理单元,用于判断所述语音数据中是否包括目标设备的名称;在所述语音数据中包括所述目标设备的名称时,将所述语音操控指令转换成设备控制指令;否则,根据所述语音数据获取目标用户的身份信息,根据所述身份信息调用语义推理模型确定目标设备;
所述收发单元,还用于向所述目标设备发送所述设备控制指令。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于OPPO广东移动通信有限公司,未经OPPO广东移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110262462.0/1.html,转载请声明来源钻瓜专利网。