[发明专利]一种基于人工智能的智能设备唤醒方法和装置在审
申请号: | 201911158856.0 | 申请日: | 2019-11-22 |
公开(公告)号: | CN110890093A | 公开(公告)日: | 2020-03-17 |
发明(设计)人: | 陈杰;苏丹;金明杰;朱振岭 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王兆林 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 人工智能 智能 设备 唤醒 方法 装置 | ||
本申请实施例公开了一种智能设备唤醒的方法及装置,在智能设备采集到待识别音频数据后,在验证待识别音频数据是否包含智能设备所对应唤醒词的过程中,保存根据待识别音频数据确定的声学特征;当一级验证确定待识别音频数据中包含唤醒词后,不唤醒智能设备,而是先进行二级验证,从保存的声学特征中确定待定特征序列,根据唤醒词的声学特征序列确定待定特征序列是否满足唤醒条件;在确定待定特征序列满足唤醒条件后,待识别音频数据通过一级和二级验证,此时唤醒智能设备。通过利用一级验证确定的声学特征,并根据声学特征提取待定特征序列进行二级验证,有效的降低对智能设备的错误唤醒频率。
技术领域
本申请涉及数据处理领域,特别是涉及一种基于人工智能的智能设备唤醒方法和装置。
背景技术
目前智能设备越来越普及,广泛的应用在人们的工作、生活之中。
一些智能设备在不提供服务时处于休眠状态,用户在需要使用这类智能设备时,可以通过语音的方式说出唤醒词对智能设备进行唤醒,例如用户可以通过唤醒词唤醒休眠的智能音箱。
然而目前的相关技术会有较高的误唤醒率,即将一些噪声或非唤醒词的语音错误识别为唤醒词的语音,而错误的唤醒智能设备,使得智能设备在用户不需要的情况下突然启动,对用户造成不好的使用体验。
发明内容
为了解决上述技术问题,本申请提供了一种智能设备唤醒方法,利用一级验证确定的声学特征,并根据声学特征提取待定特征序列进行二级验证,有效的降低对智能设备的错误唤醒频率,提高了用户体验。
本申请实施例公开了如下技术方案:
第一方面,本申请实施例提供了一种智能设备唤醒方法,所述方法包括:
在验证待识别音频数据是否包含智能设备所对应唤醒词的过程中,保存根据所述待识别音频数据确定的声学特征,所述声学特征用于标识所述待识别音频数据的声学特点;
若通过所述待识别音频数据中的目标音频帧确定所述待识别音频数据包含所述唤醒词,从保存的所述声学特征中确定待定特征序列,所述待定特征序列包括所述待识别音频数据中多个连续音频帧的声学特征,所述多个连续音频帧中包括所述目标音频帧;
根据所述唤醒词的声学特征序列确定所述待定特征序列是否满足唤醒条件;
若满足,唤醒所述智能设备。
第二方面,本申请实施例提供了一种智能设备唤醒装置,所述装置包括第一确定单元、第二确定单元、第三确定单元、唤醒单元:
所述第一确定单元,用于在验证待识别音频数据是否包含智能设备所对应唤醒词的过程中,保存根据所述待识别音频数据确定的声学特征,所述声学特征用于标识所述待识别音频数据的声学特点;
所述第二确定单元,用于若通过所述待识别音频数据中的目标音频帧确定所述待识别音频数据包含所述唤醒词,从保存的所述声学特征中确定待定特征序列,所述待定特征序列包括所述待识别音频数据中多个连续音频帧的声学特征,所述多个连续音频帧中包括所述目标音频帧;
所述第三确定单元,用于根据所述唤醒词的声学特征序列确定所述待定特征序列是否满足唤醒条件;
所述唤醒单元,用于若所述待定特征序列满足唤醒条件,唤醒所述智能设备。
第三方面,本申请实施例提供了一种智能设备的唤醒词更新方法,所述方法包括:
获取智能设备发送的待更新唤醒词的文本特征;
根据所述文本特征生成所述待更新唤醒词的音频数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911158856.0/2.html,转载请声明来源钻瓜专利网。