[发明专利]服务器侧热词有效

专利信息
申请号: 201780086256.0 申请日: 2017-10-30
公开(公告)号: CN110268469B 公开(公告)日: 2023-05-23
发明(设计)人: A.H.格伦斯坦;P.阿列克西克;J.沙尔克维克;P.J.M.门吉巴 申请(专利权)人: 谷歌有限责任公司
主分类号: G10L15/30 分类号: G10L15/30;G10L15/32;G10L15/183
代理公司: 北京市柳沈律师事务所 11105 代理人: 金玉洁
地址: 美国加利*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种方法、系统,以及设备,包含计算机储存介质上编码的计算机程序,以使用服务器检测热词。方法中的一种包含接收音频信号,音频信号编码一个或多个话语,包含第一话语;确定第一话语的至少一部分是否满足作为关键短语的至少一部分的第一阈值;响应于确定第一话语的至少该部分满足作为关键短语的至少一部分的第一阈值,将音频信号发送到服务器系统,服务器系统确定第一话语是否满足作为关键短语的第二阈值,第二阈值限制性比第一阈值更高;以及当服务器系统确定第一话语满足第二阈值时,接收标记文本数据,标记文本数据表示音频信号中编码的一个或多个话语。
搜索关键词: 服务器 侧热词
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201780086256.0/,转载请声明来源钻瓜专利网。

同类专利
  • 用于自动语音识别的本地执行的设备仲裁-202180088457.0
  • 马修·谢里菲;维克托·克尔布内 - 谷歌有限责任公司
  • 2021-12-14 - 2023-09-15 - G10L15/30
  • 能够基于使用给定客户端设备生成的口头话语的候选文本表示和/或基于各自使用对应的附加客户端设备生成的口头话语的一个或多个附加候选文本表示来生成口头话语的文本表示。各种实施方式包括从具有给定客户端设备的环境中的一组附加客户端设备确定附加客户端设备。各种实施方式附加地或可替代地包括基于由给定客户端设备的麦克风捕获的音频数据和/或基于由附加客户端设备的麦克风捕获的附加音频数据来确定附加客户端设备是否将生成口头话语的附加候选文本表示。
  • 用于提供安全自动化助理的方法和系统-202180088109.3
  • 马修·谢里菲;维克托·克尔布内 - 谷歌有限责任公司
  • 2021-12-10 - 2023-08-25 - G10L15/30
  • 本文描述的实施方式涉及:接收指向自动化助理的用户输入;处理用户输入以确定是否需要来自服务器和/或第三方应用的数据来执行包括在用户输入中的助理命令的特定履行;以及生成请求用户同意向服务器和/或第三方应用传输请求以获得执行特定履行所需的数据的提示。在用户同意的实施方式中,可以获得并利用该数据来执行特定履行。在用户不同意的实施方式中,客户端数据可以在客户端设备处本地生成并用于执行助理命令的替代履行。在各种实施方式中,可以基于在接收到用户输入时捕获的环境噪声来修改传输到服务器和/或第三方应用的请求。
  • 减弱自动语音识别处理结果-202180081357.5
  • 马修·谢里菲;维克托·克尔布内 - 谷歌有限责任公司
  • 2021-11-16 - 2023-08-04 - G10L15/30
  • 用于减弱语音处理的方法(300)包括:在声音启用装置(110)处接收麦克风触发事件(202)的指示,该指示用于指示通过语音与装置可能的交互,其中,该装置具有麦克风(116),麦克风(116)在打开时被配置为捕捉语音。响应于接收麦克风触发事件的指示,方法还包括指令麦克风打开或在持续时间窗口(212)内保持打开,以捕捉音频流(16),以及将由打开的麦克风捕捉的音频流提供给语音识别系统(150)。在持续时间窗口期间,方法进一步包括基于持续时间窗口的功能来减弱语音识别处理的等级(222),以及指令语音识别系统在音频流上使用语音识别处理的减弱的等级(204,222)。
  • 数字助理服务的远场延伸-201880002639.X
  • Y·金姆;C·斯苏瓦纳努科恩;D·A·卡尔森;T·R·格鲁贝尔;J·G·宾德尔 - 苹果公司
  • 2018-05-16 - 2023-07-21 - G10L15/30
  • 本公开提供了用于操作智能自动化助理以提供数字助理服务的延伸的系统和过程。一种示例方法包括:在具有一个或多个处理器的电子设备处,从第一用户接收表示用户请求的第一语音输入。所述方法还包括获得所述第一用户的身份;并且根据所述用户身份,向第二电子设备或第三电子设备中的至少一者提供对所述用户请求的表示。所述方法还包括:基于确定是所述第二电子设备或所述第三电子设备还是其两者将向所述第一电子设备提供所述响应,从所述第二电子设备或所述第三电子设备接收对所述用户请求的所述响应。所述方法还包括向所述第一用户提供对所述响应的表示。
  • 服务器侧热词-201780086256.0
  • A.H.格伦斯坦;P.阿列克西克;J.沙尔克维克;P.J.M.门吉巴 - 谷歌有限责任公司
  • 2017-10-30 - 2023-05-23 - G10L15/30
  • 一种方法、系统,以及设备,包含计算机储存介质上编码的计算机程序,以使用服务器检测热词。方法中的一种包含接收音频信号,音频信号编码一个或多个话语,包含第一话语;确定第一话语的至少一部分是否满足作为关键短语的至少一部分的第一阈值;响应于确定第一话语的至少该部分满足作为关键短语的至少一部分的第一阈值,将音频信号发送到服务器系统,服务器系统确定第一话语是否满足作为关键短语的第二阈值,第二阈值限制性比第一阈值更高;以及当服务器系统确定第一话语满足第二阈值时,接收标记文本数据,标记文本数据表示音频信号中编码的一个或多个话语。
  • 当确定是否从某些客户端设备卸载助理相关处理任务时补偿硬件差异-202080101326.7
  • 维克拉姆·阿加尔瓦尔;苏雷什·巴特楚 - 谷歌有限责任公司
  • 2020-05-27 - 2023-02-03 - G10L15/30
  • 本文阐述的实施方式涉及基于不限于信号强度的网络度量将计算任务卸载到单独的计算设备,或暂时停止这种卸载。相反,用于确定是否继续依赖与服务器计算设备的网络连接用于某些计算任务的网络度量能够是基于与服务器计算设备的当前或最近交互。以这种方式,在具有强大天线但以其他方式受限的网络速度的计算设备处执行的应用能够确定暂时排他性地依赖本地处理。例如,即使可能看起来存在足够的信号强度来有效地传送音频数据,自动助理也能够响应于确定网络度量未能满足阈值而在对话会话期间暂时停止将音频数据传递到远程服务器计算设备。
  • 跨计算设备和/或对话会话维护语音假设-202080100904.5
  • 马修·谢里菲;维克托·克尔布内 - 谷歌有限责任公司
  • 2020-12-14 - 2023-01-13 - G10L15/30
  • 实现方式能够在计算设备处接收与用户的口语话语相对应的音频数据,处理该音频数据以针对口语话语的一个或多个部分生成多个语音假设,选择语音假设中的给定一个,使得语音假设中的给定一个作为与软件应用相关联的转录的部分被并入,并且存储多个语音假设。在一些实现方式中,当转录在附加计算设备处被访问时,能够在附加计算设备处加载多个语音假设。在附加或替代实现方式中,当软件应用被重新激活时和/或当与转录相关联的后续对话会话被发起时,能够将多个语音假设加载到计算设备的存储器中。
  • 语音处理系统-202180012894.4
  • 蒂莫西·华林;凯瑟琳·米歇尔·卢;卡尔文·彭勇·阮 - 亚马逊技术公司
  • 2021-01-20 - 2022-10-11 - G10L15/30
  • 一种系统可以包括第一和第二语音处理系统。所述第一语音处理系统可以处理接收到的音频数据并确定其中表示的命令与第二语音处理系统相关联。所述第一语音处理系统可以向所述第二语音处理系统发送命令数据并接收响应数据作为回应。然后,所述第一语音处理系统可以处理所述响应数据以确定包括所述第二语音处理系统的指示的第二响应数据,并产生对应于所述第二响应数据的音频输出。
  • 适应第三方服务器的设备状态报告的差异-201980089841.5
  • 倪宇钊 - 谷歌有限责任公司
  • 2019-02-08 - 2021-09-03 - G10L15/30
  • 本文的实施方式涉及描述技术系统的一个或多个内部状态的信息。本文中的所述方式被提供用于至少在报告第三方设备状态时表征各种不同的第三方服务器的可靠性,以及适应受这种可靠性影响的设备生态系统的协议。延迟能够影响由助理设备表示的设备状态的准确性。当响应于用户请求而报告更新的设备状态时,某些服务器能够被表征为特别延迟的,并且结果,第三方服务器能够与表征第三方服务器的相对延迟的度量相关。当度量无法满足特定阈值时,与第三方设备的“生态系统”相关联的服务器和/或客户端能够肯定地操作以检索设备状态更新,而不是被动地等待来自对应的第三方服务器的更新。
  • 具有动态可切换端点的基于语音的用户接口-201880091341.0
  • 黄海斌;张弛;徐小峰;张晨;王冬岩 - 美的集团股份有限公司
  • 2018-11-23 - 2020-11-24 - G10L15/30
  • 一种对具有动态可切换端点设备的数字助理进行控制的方法和系统,包括:针对从用户到计算系统的多个基于语音的请求中的每个基于语音的请求动态地选择相应的输入端点设备和相应的受控设备,包括:在第一时间点,从两个或更多个输入端点设备的第一集合中获取第一语音输入的相应实例;基于已经从两个或更多个输入端点设备的第一集合中获取到的第一语音输入的相应实例,来获得第一语音输入的代表性副本;基于第一语音输入的代表副本确定第一可执行意图;根据第一可执行意图,将第一编码指令分派给从多个受控端点设备中选择的第一受控端点设备。
  • 低带宽联网系统中的音频处理-201880003511.5
  • 杰里米·佩恩;托默·阿马里利奥 - 谷歌有限责任公司
  • 2018-08-01 - 2020-03-10 - G10L15/30
  • 本公开一般涉及一种用于检测在低带宽网络上发送的输入音频信号内的激活短语的系统。所述系统可以使用两阶段激活短语检测过程。首先,可以包括用于检测输入音频信号的多个麦克风的感测设备可以检测包括候选激活短语的输入音频信号。其次,感测设备可以将输入音频信号的记录发送到客户端设备,以确认输入音频信号包括激活短语。
  • 改进的用于ASR的混合控制器-201280076276.7
  • D·维利特;吴建雄;P·沃兹拉;W·F·甘农三世 - 纽昂斯通讯公司
  • 2012-10-04 - 2018-10-30 - G10L15/30
  • 描述了一种适于自动语音识别(ASR)的移动设备。语音输入部接收来自用户的未知语音输入信号。本地控制器确定远程ASR处理条件是否满足,将语音输入信号转换为许多不同的语音表示类型中的所选一种,并发送转换后的语音输入信号到远程服务器用于远程ASR处理。本地ASR布置执行语音输入的本地ASR处理,本地ASR处理包括处理从远程服务器接收到的任何语音识别结果。
  • 分布式NLU/NLP-201380069684.4
  • 马蒂厄·赫伯特;让-菲利浦·罗比肖;克里斯多佛·M·帕里西安 - 纽昂斯通讯公司
  • 2013-11-07 - 2015-09-16 - G10L15/30
  • 描述了一种用于分布式自然语言处理的系统和对应方法。一组本地数据源存储在移动设备上。移动设备上的本地自然语言理解(NLU)匹配模块执行结合本地数据源的自然语言输入的自然语言处理,以确定一个或多个本地解释候选。移动设备上的本地NLU排名模块处理本地解释候选和来自远程NLU服务器的一个或多个远程解释候选,以确定对应于自然语言输入的最终输出解释。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top