[发明专利]一种语音控制场景方法和语音控制场景系统在审
申请号: | 202111302607.1 | 申请日: | 2021-11-04 |
公开(公告)号: | CN113870857A | 公开(公告)日: | 2021-12-31 |
发明(设计)人: | 胡丽华;龙小昂;吴必升 | 申请(专利权)人: | 深圳华龙讯达信息技术股份有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/30 |
代理公司: | 北京中政联科专利代理事务所(普通合伙) 11489 | 代理人: | 赖学能 |
地址: | 518000 广东省深圳市福田区福华三*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 控制 场景 方法 系统 | ||
本发明提供一种语音控制场景方法和语音控制场景系统,应用于移动设备的系统,所述方法包括以下步骤:实时获取语音数据;根据预训练的语音‑声学神经网络模型,从语音数据中获取声学特征;检测声学特征,若声学特征包含了预设的系统唤醒声学特征,唤醒移动设备的系统;根据预训练的语音‑声纹神经网络模型,从语音数据中获取声纹特征;检测声纹特征,若声纹特征与预训练的用户声纹相同,解锁唤醒后的移动设备的系统;根据预训练的语音‑文字神经网络模型,将语音数据转换成文字数据;根据文字数据和预训练的事件数据库进行场景事件消息匹配,获得对应的场景事件消息并执行。可以提高语音控制移动设备的场景的效率,提升用户使用移动设备的体验。
技术领域
本发明涉及系统场景的控制技术领域,具体涉及一种语音控制场景方法和语音控制场景系统。
背景技术
现有的移动设备设有系统锁定状态和系统解锁状态,当所述移动设备在识别到语言命令后,需要将移动设备的系统从系统锁定状态切换成系统解锁状态后,才可以顺利执行语言命令对应的场景消息。然而,移动设备现有的解锁方式是通过密码解锁、指纹解锁和人脸识别解锁,因此当移动设备处于锁定状态情况下,用户还需要配合其他解锁方式或解锁行为才能顺利通过语音控制移动设备的场景,导致语音控制移动设备的场景的效率慢,大大降低了用户操作使用移动设备的体验。
发明内容
本发明的目的在于克服现有技术中的缺点与不足,提供一种语音控制场景方法和语音控制场景系统,可以提高语音控制移动设备的场景的效率,提升用户操作使用移动设备的体验。
本发明的一个实施例提供一种语音控制场景方法,包括以下步骤:
实时获取语音数据;
根据预训练的语音-声学神经网络模型,从所述语音数据中获取声学特征;
检测所述声学特征,若所述声学特征包含了预设的系统唤醒声学特征,唤醒所述移动设备的系统;
根据预训练的语音-声纹神经网络模型,从所述语音数据中获取声纹特征;
检测所述声纹特征,若所述声纹特征与预设置的用户解锁声纹相同,解锁唤醒后的所述移动设备的系统;
根据预训练的语音-文字神经网络模型,将所述语音数据转换成文字数据;
根据所述文字数据和预训练的事件数据库进行场景事件消息匹配,获得对应的场景事件消息并执行。
相对于现有技术,本发明的语音控制场景方法从所述语音数据中获取声学特征,根据所述声学特征唤醒所述移动设备的系统,然后从所述语音数据中获取声纹特征,根据所述声纹特征解锁唤醒后的所述移动设备的系统,再将所述语音数据转换成文字数据,根据所述文字数据获得对应的场景事件消息并执行,可以提高语音控制移动设备的场景的效率,提升用户操作使用移动设备的体验。
进一步,所述根据预训练的语音-文字神经网络模型,将所述语音数据转换成文字数据之前,还包括以下步骤:
对所述语音数据进行帧切割,得到多帧分段语音信号;
采用滤波器过滤各帧所述分段语音信号中干扰噪声;
采用高频滤波器对所述分段语音信号中高频部分进行预加重。提高语音数据转换成文字数据的准确性。
进一步,所述语音-声学神经网络模型的训练过程包括以下步骤:
获取第一语音训练样本,所述第一语音训练样本包括第一语音训练数据和声学训练特征;
利用所述第一语音训练样本对初始的语音-声学神经网络模型进行训练,得到训练好的语音-声学神经网络模型。通过训练得到所述语音-声学神经网络模型。
进一步,所述语音-声纹神经网络模型的训练过程包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳华龙讯达信息技术股份有限公司,未经深圳华龙讯达信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111302607.1/2.html,转载请声明来源钻瓜专利网。