[发明专利]热词识别有效
申请号: | 201610825577.5 | 申请日: | 2016-09-14 |
公开(公告)号: | CN107016999B | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 马修·谢里菲;雅各布·尼古劳斯·弗尔斯特 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G10L17/08 | 分类号: | G10L17/08;G10L17/22;G10L15/22;G06F16/33 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 周亚荣;安翔 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 | ||
1.一种用于热词检测的计算机实施的方法,包括:
接收对应于话语的音频数据,所述话语是在计算设备在锁定模式下操作期间被接收的,所述计算设备被配置为基于确定所述音频数据对应于热词而退出所述锁定模式;
确定所述音频数据对应于所述热词,包括:
确定所述音频数据的初始部分对应于所述热词的初始部分,以及
响应于确定所述音频数据的所述初始部分对应于所述热词的所述初始部分,使得多个独特超声波音频样本中的一个在所述音频数据的所述初始部分被接收以后被输出;
生成被确定为对应于所述热词的所述音频数据的热词音频指纹;
确定所述热词音频指纹与先前被确定为对应于所述热词的音频数据的一个或多个所存储的音频指纹之间的相似度;
基于所述热词音频指纹与所述一个或多个所存储的音频指纹中的一个之间的所述相似度是否满足预先确定的阈值,检测所述热词音频指纹是否与先前被确定为对应于所述热词的音频数据的所存储的音频指纹相匹配;以及
响应于检测到所述热词音频指纹匹配所存储的音频指纹,虽已确定所述音频数据对应于所述热词,仍然阻止向其说出了所述话语的所述计算设备退出所述锁定模式。
2.根据权利要求1所述的计算机实施的方法,其中,确定所述音频数据对应于所述热词还包括:
辨识所述音频数据的一个或多个声学特征;
将所述音频数据的所述一个或多个声学特征跟与存储在数据库中的一个或多个热词相关联的一个或多个声学特征相比较;以及
基于所述音频数据的所述一个或多个声学特征跟与存储在所述数据库中的一个或多个热词相关联的所述一个或多个声学特征的比较,确定所述音频数据对应于存储在所述数据库中的所述一个或多个热词中的一个。
3.根据权利要求1所述的计算机实施的方法,进一步包括:
接收对应于附加话语的附加音频数据;
使用所述附加音频数据辨识说话者辨识d-向量;
确定来自所述附加音频数据的所述说话者辨识d-向量与来自对应于所述话语的所述音频数据的热词d-向量之间的相似度;
基于来自所述附加音频数据的所述说话者辨识d-向量与来自对应于所述话语的所述音频数据的所述热词d-向量之间的所述相似度是否满足特定阈值,检测对应于所述热词的所述音频数据是否匹配所述附加音频数据;以及
响应于检测到对应于所述热词的所述音频数据不匹配所述附加音频数据,禁止对所述计算设备的访问。
4.根据权利要求1所述的计算机实施的方法,其中,所述热词是特定词项,所述特定词项触发对跟在所述特定词项之后的一个或多个词项中的附加词项的语义解释。
5.根据权利要求1所述的计算机实施的方法,进一步包括:
接收对应于话音命令或查询的附加音频数据;以及
确定所述话音命令或查询的类型,
其中,所述预先确定的阈值基于所述话音命令或查询的所述类型来调整。
6.根据权利要求1所述的计算机实施的方法,进一步包括:
确定所接收的音频数据包括对应于所述多个独特超声波音频样本中的一个的音频数据;以及
响应于确定所接收的音频数据包括对应于所述多个独特超声波音频样本中的一个的音频数据,禁止对所述计算设备的访问。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610825577.5/1.html,转载请声明来源钻瓜专利网。