[发明专利]语音识别系统有效
申请号: | 201611207951.1 | 申请日: | 2016-12-23 |
公开(公告)号: | CN107039040B | 公开(公告)日: | 2021-02-12 |
发明(设计)人: | 佩德罗·J·莫雷诺·门吉巴尔;彼塔尔·阿列克西克 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/08 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 周亚荣;安翔 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 系统 | ||
本发明提供了一种语音识别系统以及用于语音识别的方法和装置,其包括被编码在计算机存储介质上的计算机程序。在一个方面,一种方法包括下列步骤:接收语音输入;确定该语音输入的转录文字,其中,对于该语音输入的多个分段,确定该语音输入的转录文字的步骤包括:获取该语音输入的第一分段的第一候选转录文字;确定与该第一候选转录文字相关联的一个或多个场境;调整所述一个或多个场境中的每一个场境的相应权重;以及,部分地基于调整后的权重来确定该语音输入的第二分段的第二候选转录文字;以及,提供该语音输入的所述多个分段的转录文字以供输出。
技术领域
本发明涉及语音识别。
背景技术
常规的语音识别系统旨在将来自用户的语音输入转换为文本输出。该文本输出可用于各种用途,例如包括:作为搜索查询、命令、文字处理输入等。在典型的语音搜索系统中,语音界面接收用户的语音输入并将该语音输入提供给语音识别引擎。语音识别引擎将该语音输入转换为文本搜索查询。语音搜索系统然后向搜索引擎提交该文本搜索查询,以获得一个或多个搜索结果。
发明内容
总的来说,本说明书中描述的主题的一个创新方面可以实施在以下方法中,该方法包括以下步骤:接收将语音输入编码的数据;确定该语音输入的转录文字(transcription),其中,对于该语音输入的多个分段,确定该语音输入的转录文字包括:获取该语音输入的第一分段的第一候选转录文字;确定与该第一候选转录文字相关联的一个或多个场境(contexts);调整所述一个或多个场境中的每一个场境的相应权重;以及部分地基于调整后的权重来确定该语音输入的第二分段的第二候选转录文字;以及,提供该语音输入的所述多个分段的转录文字以供输出。本说明书中描述的方法可以实施为计算机实现的方法。此方面的其他实施例包括相应的计算机系统、装置和记录在一个或多个计算机存储设备上的计算机程序中,该计算机系统、装置和计算机程序中的每一个均被配置为执行所述方法的步骤。对于要配置成执行特定操作或动作的一个或多个计算机的系统,意味着该系统已安装于在操作中使该系统执行所述操作或动作的软件、固件、硬件或其组合上。对于要配置成执行特定操作或动作的一个或多个计算机程序,意味着所述一个或多个程序包括如下的指令:当该指令被数据处理装置执行时,该指令使装置执行所述操作或动作。
本说明书中描述的主题的另一创新方面可以实施为存储有软件的计算机可读介质,该软件包括可由一个或多个计算机执行的指令,当进行这种执行时,该指令使所述一个或多个计算机执行以下操作,包括:接收将语音输入编码的数据;确定该语音输入的转录文字,其中,对于该语音输入的多个分段,确定该语音输入的转录文字包括:获取该语音输入的第一分段的第一候选转录文字;确定与第一候选转录文字相关联的一个或多个场境;调整所述一个或多个场境中的每一个场境的相应权重;以及,部分地基于调整后的权重来确定该语音输入的第二分段的第二候选转录文字;以及,提供该语音输入的所述多个分段的转录文字以供输出。
前述和其它实施例中的每一个均能够可选地包括以下特征中的一个或多个(单独地或以它们的任何组合)。例如,一个实施例包括以下所有特征的组合。所述方法包括获取语音输入的第一分段的第一候选转录文字:确定该语音输入的第一分段满足稳定性标准;以及,响应于确定该语音输入的第一分段满足稳定性标准来获取该语音输入的第一分段的第一候选转录文字。所述稳定性标准包括该语音输入的第一分段的一个或多个语义特征(semantic characteristics)。所述稳定性标准包括该语音输入的第一分段之后发生的时间延迟。该语音输入的第二分段出现在该语音输入的第一分段之后。所述一个或多个场境是从用户设备接收的。所述一个或多个场境包括以下的数据:该数据包括用户的地理位置、用户的搜索历史、用户的兴趣、或用户的活动。所述方法包括:存储对多个场境的多个评分;以及,响应于对所述一个或多个场境中的每一个场境的相应权重的调整来更新所述一个或多个场境的调整后的评分。所述方法还包括将该输出作为一个搜索查询(search query)来提供,例如提供给搜索引擎,然后,搜索引擎可以响应于该搜索查询而向用户设备提供一个或多个搜索结果。所述第一候选转录文字包括单词、子词或词组。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611207951.1/2.html,转载请声明来源钻瓜专利网。