[发明专利]一种智能设备唤醒方法及装置在审

申请号：	201911098662.6	申请日：	2019-11-12
公开（公告）号：	CN112863500A	公开（公告）日：	2021-05-28
发明（设计）人：	杜国威	申请（专利权）人：	北京安云世纪科技有限公司
主分类号：	G10L15/22	分类号：	G10L15/22
代理公司：	北京律诚同业知识产权代理有限公司 11006	代理人：	王玉双
地址：	100102 北京市朝阳区酒仙桥路***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种智能设备唤醒方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种智能设备的唤醒方法及装置，所述方法包括：获取语音数据；识别所述语音数据的语速快慢，获得语音语速；根据所述语音语速，确定识别策略；基于所述识别策略对所述语音数据进行唤醒词的识别，获得识别结果；若所述识别结果为识别到预设的唤醒词，则唤醒所述智能设备。本发明解决了现有的语音智能设备容易出现无法唤醒和误唤醒的问题。

技术领域

本发明涉及语音识别及人工智能技术领域，尤其涉及一种智能设备唤醒方法及装置。

背景技术

对于如智能音箱的这类可进行语音交互的智能设备，往往在未使用的时候是处于休眠状态，以此进行节能、避免浪费电量。在需要进行使用的时候需要先对智能音箱进行唤醒，唤醒的常用方式为语音唤醒。语音唤醒时，用户可直接说出预设的激活词来唤醒音箱，例如：“天猫精灵”，“小爱同学”，“若琪”等。当智能音箱识别到预设的激活词时就会启动智能音箱的大多数或全部功能进行工作，完成用户下达的相关指令。

目前为了避免误唤醒，一般将唤醒词设置为4个音节。但当用户以较快的语速说出唤醒词时，会导致唤醒词的表述较为模糊，识别成功率严重下降，出现无法唤醒的情况。

发明内容

鉴于上述问题，本发明提出了一种智能设备唤醒方法及装置，解决了现有的语音智能设备容易出现无法唤醒或误唤醒的问题。

第一方面，本申请通过一实施例提供如下技术方案：

一种智能设备的唤醒方法，应用于智能设备中，所述方法包括：

获取语音数据；识别所述语音数据的语速快慢，获得语音语速；根据所述语音语速，确定识别策略；基于所述识别策略对所述语音数据进行识别，获得识别结果；若所述识别结果为识别到预设的唤醒词，则唤醒所述智能设备。

优选地，所述识别策略包括所述语音数据的各字节对应的识别标准，所述识别标准为所述语音数据的字节与所述唤醒词的字节匹配成功的最低相似度，所述基于所述识别策略对所述语音数据进行识别，获得识别结果，包括：

比对所述语音数据的字节与所述唤醒词的字节，获得字节相似度；比较所述字节相似度与所述识别标准，获得所述识别结果。

优选地，所述识别策略包括：第一识别标准、第二识别标准和第三识别标准，其中，所述第一识别标准高于所述第二识别标准，所述第二识别标准高于所述第三识别标准。

优选地，所述根据所述语音语速，确定识别策略，包括：

将所述语音语速与预设的语速进行比较；当所述语音语速比所述预设的语速快时，确定对所述语音数据的首尾两端的字节进行识别的识别标准为所述第一识别标准。

优选地，所述根据所述语音语速，确定识别策略，包括：

将所述语音语速与预设的语速进行比较；当所述语音语速比所述预设的语速快时，确定对所述语音数据的首尾两端的字节进行识别的识别标准为所述第二识别标准；此时，所述基于所述识别策略对所述语音数据进行识别包括：若识别到所述唤醒词的首字节和尾字节，则将所述语音数据上传至服务器，以使得所述服务器对所述语音数据的首尾两端的字节进行识别。

优选地，所述将所述语音语速与预设的语速进行比较之后，还包括：

当所述语音语速比所述预设的语速快时，确定对所述首尾两端之间的字节进行识别的识别标准为所述第三识别标准。

优选地，所述将所述语音语速与预设的语速进行比较之后，还包括：

当所述语音语速比所述预设的语速慢时，或当所述语音语速和所述预设的语速相等时，确定对所述语音数据的所有字节进行识别的识别标准为所述第二识别标准。

优选地，所述识别所述语音数据的语速快慢，获得语音语速，包括：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京安云世纪科技有限公司，未经北京安云世纪科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201911098662.6/2.html，转载请声明来源钻瓜专利网。