[发明专利]小尺寸多通道关键字定位在审
申请号: | 202080093004.2 | 申请日: | 2020-01-15 |
公开(公告)号: | CN114945980A | 公开(公告)日: | 2022-08-26 |
发明(设计)人: | 沃纪龙;黄亦腾 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G10L15/16 | 分类号: | G10L15/16;G10L15/28 |
代理公司: | 上海华诚知识产权代理有限公司 31300 | 代理人: | 肖华 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种检测说出的话语(120)中的热字的方法(800)包括,接收表征流传输多通道音频(118)的输入帧(210)序列。流传输多通道音频的每个通道(119)包括由单独专用麦克风(107)所捕获的相应音频特征(510)。对于每个输入帧,该方法包括,使用记忆神经网络(300)的三维(3D)奇异值分解过滤器(SVDF)输入层(302)来并行地处理每个通道的相应音频特征,以及基于相应音频特征的连接(344)来生成对应的多通道音频特征表示(420)。该方法还包括,使用顺序堆叠的SVDF层(350)来生成指示音频中热字的存在的概率分数(360)。该方法还包括,确定概率分数是否满足阈值,以及当满足时,在用户设备(102)上启动唤醒处理。 | ||
搜索关键词: | 尺寸 通道 关键字 定位 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202080093004.2/,转载请声明来源钻瓜专利网。
- 上一篇:一种电吸收调制激光器和光模块
- 下一篇:放大的空芯光纤传输