[发明专利]一种基于人工智能的智能设备唤醒方法和装置在审

申请号：	201911158856.0	申请日：	2019-11-22
公开（公告）号：	CN110890093A	公开（公告）日：	2020-03-17
发明（设计）人：	陈杰;苏丹;金明杰;朱振岭	申请（专利权）人：	腾讯科技（深圳）有限公司
主分类号：	G10L15/22	分类号：	G10L15/22;G10L15/26
代理公司：	深圳市深佳知识产权代理事务所(普通合伙) 44285	代理人：	王兆林
地址：	518057 广东省深圳***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于人工智能智能设备唤醒方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请实施例公开了一种智能设备唤醒的方法及装置，在智能设备采集到待识别音频数据后，在验证待识别音频数据是否包含智能设备所对应唤醒词的过程中，保存根据待识别音频数据确定的声学特征；当一级验证确定待识别音频数据中包含唤醒词后，不唤醒智能设备，而是先进行二级验证，从保存的声学特征中确定待定特征序列，根据唤醒词的声学特征序列确定待定特征序列是否满足唤醒条件；在确定待定特征序列满足唤醒条件后，待识别音频数据通过一级和二级验证，此时唤醒智能设备。通过利用一级验证确定的声学特征，并根据声学特征提取待定特征序列进行二级验证，有效的降低对智能设备的错误唤醒频率。

技术领域

本申请涉及数据处理领域，特别是涉及一种基于人工智能的智能设备唤醒方法和装置。

背景技术

目前智能设备越来越普及，广泛的应用在人们的工作、生活之中。

一些智能设备在不提供服务时处于休眠状态，用户在需要使用这类智能设备时，可以通过语音的方式说出唤醒词对智能设备进行唤醒，例如用户可以通过唤醒词唤醒休眠的智能音箱。

然而目前的相关技术会有较高的误唤醒率，即将一些噪声或非唤醒词的语音错误识别为唤醒词的语音，而错误的唤醒智能设备，使得智能设备在用户不需要的情况下突然启动，对用户造成不好的使用体验。

发明内容

为了解决上述技术问题，本申请提供了一种智能设备唤醒方法，利用一级验证确定的声学特征，并根据声学特征提取待定特征序列进行二级验证，有效的降低对智能设备的错误唤醒频率，提高了用户体验。

本申请实施例公开了如下技术方案：

第一方面，本申请实施例提供了一种智能设备唤醒方法，所述方法包括：

在验证待识别音频数据是否包含智能设备所对应唤醒词的过程中，保存根据所述待识别音频数据确定的声学特征，所述声学特征用于标识所述待识别音频数据的声学特点；

若通过所述待识别音频数据中的目标音频帧确定所述待识别音频数据包含所述唤醒词，从保存的所述声学特征中确定待定特征序列，所述待定特征序列包括所述待识别音频数据中多个连续音频帧的声学特征，所述多个连续音频帧中包括所述目标音频帧；

根据所述唤醒词的声学特征序列确定所述待定特征序列是否满足唤醒条件；

若满足，唤醒所述智能设备。

第二方面，本申请实施例提供了一种智能设备唤醒装置，所述装置包括第一确定单元、第二确定单元、第三确定单元、唤醒单元：

所述第一确定单元，用于在验证待识别音频数据是否包含智能设备所对应唤醒词的过程中，保存根据所述待识别音频数据确定的声学特征，所述声学特征用于标识所述待识别音频数据的声学特点；

所述第二确定单元，用于若通过所述待识别音频数据中的目标音频帧确定所述待识别音频数据包含所述唤醒词，从保存的所述声学特征中确定待定特征序列，所述待定特征序列包括所述待识别音频数据中多个连续音频帧的声学特征，所述多个连续音频帧中包括所述目标音频帧；

所述第三确定单元，用于根据所述唤醒词的声学特征序列确定所述待定特征序列是否满足唤醒条件；

所述唤醒单元，用于若所述待定特征序列满足唤醒条件，唤醒所述智能设备。

第三方面，本申请实施例提供了一种智能设备的唤醒词更新方法，所述方法包括：

获取智能设备发送的待更新唤醒词的文本特征；

根据所述文本特征生成所述待更新唤醒词的音频数据；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于腾讯科技（深圳）有限公司，未经腾讯科技（深圳）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201911158856.0/2.html，转载请声明来源钻瓜专利网。

上一篇：一种日志传输方法、装置及电子设备和存储介质
下一篇：用于提升植烟土壤微生态环境水平的生物菌剂

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于人工智能的智能设备唤醒方法和装置在审

专利文献下载