[发明专利]识别带口音的语音在审
申请号: | 201480013019.8 | 申请日: | 2014-01-24 |
公开(公告)号: | CN105408952A | 公开(公告)日: | 2016-03-16 |
发明(设计)人: | K·A·格雷 | 申请(专利权)人: | 谷歌技术控股有限责任公司 |
主分类号: | G10L15/187 | 分类号: | G10L15/187 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 酆迅 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 口音 语音 | ||
背景技术
在识别带口音说出时的语音方面,当前的语音识别技术是相当差的。为了解决这一问题,一个部分解决方案跟踪由用户响应于当前技术未能正确地识别词语所做出的校正。这一部分解决方案可能对于带口音的用户来说是令人沮丧的,因为在这些当前技术改善它们的识别之前,用户往往必须校正许多未正确识别的词语,往往如此多次以至于用户完全放弃声音识别。即使对于那些花时间和经得起挫折的用户,当该用户带有口音时,当前的许多技术仍然未充分地识别用户的语音。
用于解决这一问题的另一部分解决方案要求用户去向专用用户接口并且说出特定词语的列表。要求带口音的用户找到这一专用用户接口并且说出词语列表无法提供优越的用户体验,并且因而往往将根本不会被用户执行。进一步地,要求来自用户的这一努力无法使得当前技术能够足够好地识别口音。再进一步地,即使拥有设备的用户向这方面努力,也不太可能由借用所有者的设备的另一用户来执行,诸如当设备的所有者在开车并且乘客使用所有者的设备时。
附图说明
参照附图描述用于识别带口音的语音的技术和装置。贯穿附图,相同的数字用于引用同样的特征和部件:
图1图示其中可以实现用于识别带口音的语音的技术的示例环境。
图2图示图1的示例语言和口音库。
图3图示用于使用基于设备数据确定的口音库来识别带口音的语音的示例方法。
图4图示用于更改口音库以更准确地识别带口音的语音的示例方法。
图5图示用于在基于应用字段的语音识别水平下识别语音的示例方法,其可以使用口音库。
图6图示具有应用字段的示例应用。
图7图示其可以实现用于识别带口音的语音的技术的示例装置的各种部件。
具体实施方式
在识别带口音说出时的语音方面,用于识别带口音的语音的当前技术往往是相当差的。本公开描述用于使用口音库来识别带口音的语音的技术和装置,并且在一些实施例中,使用基于应用字段的不同语音识别校正水平,识别的词语被设置为提供到该应用字段中。
以下讨论首先描述操作环境,其后是可以在这一环境中采用的技术、具有应用字段的示例应用、并且继续进行到示例装置。
图1图示其中可以实现用于识别带口音的语音的技术的示例环境100。示例环境100包括计算设备102,计算设备102具有一个或多个处理器104、计算机可读存储介质(存储介质)106、显示器108和输入机制110。
计算设备102被示出为具有集成麦克风112作为输入机制110的一个示例的智能电话。然而,可以使用各种类型的计算设备和输入机制,诸如具有分立独立麦克风的个人计算机、连接到具有麦克风的微微网(例如,BluetoothTM)耳机的蜂窝电话、或者具有集成立体声麦克风的平板和膝上型计算机(仅举几例)。
计算机可读存储介质106包括口音模块114、设备数据116、挖掘数据118和应用120。口音模块114包括语言库122和一个或多个口音库124。口音模块114可以在有语音识别引擎(未示出)的情况下操作、在无语音识别引擎的情况下操作、包括语音识别引擎、与语音识别引擎集成、和/或补充语音识别引擎。口音模块114能够识别带口音的语音,诸如通过基于设备数据116确定与语言库122结合用于识别语音的口音库124中的口音库。
语言库122与语言或其方言相关联,诸如澳大利亚英语、美国(US)英语、英国(皇家)英语等。语言库122和已知的语音识别引擎可以操作为执行已知的语音识别,虽然不要求使用任一者或两者。因而,在一些实施例中,口音模块114使用口音库124之一来补充使用已知类型的语言库122的已知语音识别引擎。
通过示例的方式,考虑图2,其图示图1的示例语言库122和口音库124。这里示出两个示例语言库:澳大利亚英语204和US英语206。与这些语言库204和206中的每个相关联的分别是众多口音库208和210。
口音库208包括八个示例(虽然本技术设想更多),包括澳大利亚(AU)英语-国语208-1、AU英语-新南(N.S.)威尔士208-2、AU英语-新西兰(NZ)奥克兰208-3、AU英语-NA克赖斯特彻奇208-4、AU英语-水肺-潜水员208-5、AU英语-内陆208-6、AU英语-佩斯208-7和AU英语-印度尼西亚208-8。如从名字清楚的,这些口音库中的每个口音库与大的语言组(澳大利亚英语)和该语言组内存在的口音相关联,无论其是最近说国语的移民还是参与水肺潜水的人。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌技术控股有限责任公司,未经谷歌技术控股有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201480013019.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:利用生物酶合成接枝淀粉浆料的方法
- 下一篇:利用猪肺提取肝素钠粗品的制备工艺