[发明专利]语音识别系统有效
申请号: | 201611207951.1 | 申请日: | 2016-12-23 |
公开(公告)号: | CN107039040B | 公开(公告)日: | 2021-02-12 |
发明(设计)人: | 佩德罗·J·莫雷诺·门吉巴尔;彼塔尔·阿列克西克 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/08 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 周亚荣;安翔 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 系统 | ||
1.一种用于语音识别的方法,包括:
接收表示语音输入的数据;
确定所述语音输入的转录文字,其中,对于所述语音输入的多个分段,确定所述语音输入的转录文字的步骤包括:
维护多个场境和与所述多个场境相关联的相应基本权重;
获取所述语音输入的第一分段的第一候选转录文字;
从所述多个场境确定与所述第一候选转录文字相关联的一个或多个场境;
识别分别与所述一个或多个场境相对应的一个或多个基本权重;
基于所述第一候选转录文字来调整所述一个或多个场境中的每一个场境的所述一个或多个基本权重中的相应基本权重;以及
部分地基于所述一个或多个场境中的每一个场境的调整后的基本权重来确定所述语音输入的第二分段的第二候选转录文字;以及
提供所述语音输入的所述多个分段的转录文字以供输出。
2.根据权利要求1所述的方法,其中,获取所述语音输入的第一分段的第一候选转录文字包括:
确定所述语音输入的所述第一分段满足稳定性标准;以及
响应于确定所述语音输入的所述第一分段满足稳定性标准来获取所述语音输入的所述第一分段的所述第一候选转录文字。
3.根据权利要求2所述的方法,其中,所述稳定性标准包括所述语音输入的所述第一分段的一个或多个语义特征。
4.根据权利要求2所述的方法,其中,所述稳定性标准包括在所述语音输入的所述第一分段之后产生的时间延迟。
5.根据权利要求1所述的方法,其中,所述语音输入的所述第二分段出现在所述语音输入的所述第一分段之后。
6.根据权利要求1所述的方法,其中,所述一个或多个场境是从用户设备接收的。
7.根据权利要求6所述的方法,其中,所述一个或多个场境包括以下数据,该数据包括以下项中的一个或多个:用户的地理位置、用户的搜索历史、用户的兴趣和用户的活动。
8.根据权利要求1至7中的任一项所述的方法,包括:
存储多个场境的多个分值;以及
响应于对所述一个或多个场境中的每一个场境的相应基本权重的调整,基于调整后的基本权重来更新所述一个或多个场境的分值。
9.根据权利要求1至7中的任一项所述的方法,还包括:
提供所述输出而作为一个搜索查询。
10.根据权利要求1所述的方法,其中,所述第一候选转录文字包括单词、子词或词组。
11.一种用于语音识别的系统,包括:
一个或多个计算机和存储有指令的一个或多个存储设备,所述指令在由所述一个或多个计算机执行时使所述一个或多个计算机执行以下操作,包括:
接收表示语音输入的数据;
确定所述语音输入的转录文字,其中,对于所述语音输入的多个分段,确定所述语音输入的所述转录文字包括:
维护多个场境和与所述多个场境相关联的相应基本权重;
获取所述语音输入的第一分段的第一候选转录文字;
从所述多个场境确定与所述第一候选转录文字相关联的一个或多个场境;
识别分别与所述一个或多个场境相对应的一个或多个基本权重;
基于所述第一候选转录文字来调整所述一个或多个场境中的每一个场境的所述一个或多个基本权重中的相应基本权重;以及
部分地基于所述一个或多个场境中的每一个场境的调整后的基本权重来确定所述语音输入的第二分段的第二候选转录文字;以及
提供所述语音输入的所述多个分段的转录文字以供输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611207951.1/1.html,转载请声明来源钻瓜专利网。