[发明专利]识别带口音的语音在审
申请号: | 201480013019.8 | 申请日: | 2014-01-24 |
公开(公告)号: | CN105408952A | 公开(公告)日: | 2016-03-16 |
发明(设计)人: | K·A·格雷 | 申请(专利权)人: | 谷歌技术控股有限责任公司 |
主分类号: | G10L15/187 | 分类号: | G10L15/187 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 酆迅 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 口音 语音 | ||
1.一种方法,包括:
接收针对计算设备的设备数据;
基于所述设备数据,确定用于在语音识别中使用的口音库;
在所述计算设备处接收语音;以及
基于所述口音库,识别所述语音。
2.根据权利要求1所述的方法,其中接收针对所述计算设备的设备数据包括检索或者使得检索与所述计算设备的用户相关联的个人数据。
3.根据权利要求2所述的方法,其中所述个人数据包括联系人姓名,并且所述联系人姓名指示所述用户的原籍国。
4.根据权利要求2所述的方法,其中所述个人数据包括消息地址,并且所述消息地址包括其中说的母语与所述计算设备被设置在的语言不同的国家中的目的地。
5.根据权利要求1所述的方法,其中所述设备数据包括一个或多个安装的应用的身份、与所述计算设备被设置在的语言不同的语言相关联的键盘的类型、输入到搜索引擎中的搜索项、或者所述计算设备的类型。
6.根据权利要求1所述的方法,其中所述口音库与所述计算设备被设置在的语言以及以所述语言说出的口音相关联。
7.根据权利要求6所述的方法,其中以所述语言说出的所述口音与物理特性、文化或兴趣相关联。
8.根据权利要求1所述的方法,其中基于所述口音库识别所述语音使用与所述计算设备被设置在的语言相关联的语言库,并且所述口音库包括对所述语言库的算法的更改。
9.根据权利要求1所述的方法,进一步包括接收与所述计算设备相关联的用户的挖掘数据,所述挖掘数据包括与所述用户相关联的个人数据,并且其中确定所述口音库进一步基于所述挖掘数据。
10.根据权利要求1所述的方法,进一步包括:
在所述计算设备处接收其它语音;
基于所述其它语音,动态地确定所述其它语音不与所述口音库相关联;
确定针对所述其它语音的另一口音库或没有口音库;以及
利用所述另一口音库或没有口音库,来识别所述其它语音。
11.根据权利要求10所述的方法,其中动态地确定所述其它语音不与所述口音库相关联包括确定所述其它语音不是由与所述计算设备相关联的用户做出的。
12.根据权利要求1所述的方法,进一步包括基于从所述语音未正确识别的、由用户校正的词语,更新所述口音库。
13.一个或多个计算机可读存储介质,在其上具有处理器可执行指令,响应于由处理器的执行,所述指令执行操作,所述操作包括:
接收语音;
基于识别的文本被设置为要提供到的应用字段,确定语音识别校正水平;
在所述语音识别校正水平下识别所述语音,以产生所述识别的文本;以及
向所述应用字段提供所述识别的文本。
14.根据权利要求13所述的计算机可读存储介质,其中所述应用字段是地址字段,并且所述语音识别校正水平提供最大校正水平。
15.根据权利要求14所述的计算机可读存储介质,其中所述最大校正水平包括使用口音库,并且进一步包括基于以下项来确定所述口音库:
接收的所述语音;
与通过其接收所述语音的计算设备相关联的设备数据;或者
与所述计算设备的用户相关联的个人数据。
16.根据权利要求13所述的计算机可读存储介质,其中所述应用字段是仅数字字段,并且所述语音识别校正水平提供最大校正水平。
17.根据权利要求13所述的计算机可读存储介质,其中所述应用字段是电子邮件、博客、社交联网入口、或文字处理文档的主体,并且所述语音识别校正水平提供低于最大的校正水平。
18.根据权利要求17所述的计算机可读存储介质,其中所述语音识别引擎的所述低于最大的校正水平放弃使用口音库,并且使用比最大校正水平更少的计算资源。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌技术控股有限责任公司,未经谷歌技术控股有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201480013019.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:利用生物酶合成接枝淀粉浆料的方法
- 下一篇:利用猪肺提取肝素钠粗品的制备工艺