[发明专利]用于名称发音的系统和方法有效
申请号: | 201380018076.0 | 申请日: | 2013-02-28 |
公开(公告)号: | CN104380373B | 公开(公告)日: | 2017-08-25 |
发明(设计)人: | D·K·奈科 | 申请(专利权)人: | 苹果公司 |
主分类号: | G10L13/08 | 分类号: | G10L13/08 |
代理公司: | 中国国际贸易促进委员会专利商标事务所11038 | 代理人: | 冯玉清 |
地址: | 美国加*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 名称 发音 系统 方法 | ||
技术领域
本申请涉及识别和合成语音,并且更具体地讲,涉及识别和合成名称的发音。
背景技术
名称识别是语音识别的一个特别困难的方面。名称可包括人员、企业和其他实体的名称。名称的分布具有长尾现象。此外,对名称进行发音的方式可能是主观的,并取决于名称的来源。可能存在少数非常常见的名称,但是存在数量级更高的很罕见的名称。为了使语音识别系统对名称进行识别,通常需要语言学家转录由在其中部署语言识别系统的地区或语言所支持的语音字母表中的所有可能的发音。大多数现有的语音识别和合成系统具有最多至数百或数千个名称,而现今可能存在数百万个实际的独特名称在使用。
当前的语音识别系统通常对名称识别建模,以支持任务,诸如基于用户设备的联系人应用程序中的命名条目进行电话拨号、搜索和查询、提醒,以及事件调度。要识别或合成名称,当前系统常使用字典或词典。这些字典或词典包含名称与它们可能的发音的映射。然而,如果名称尚未在语音词典中进行建模,则系统必须猜测发音。出于语音合成的目的,系统还可能需要猜测包含在名称中的各个音节上的重音。
对于未在词典中明确建模的名称,语音识别系统通常依赖于使用复杂的字母到声音规则的发音猜测器。然而,因为某些语音单元对于特定语言是特有的,所以相同的名称可能被不同用户不同地发音。因此,现有系统不能够建立足够的发音猜测器来对来自不同语言和文化的名称的发音进行建模。在许多情况下,外国名称发音可能无法被正确地猜测,除非有明确的规则表现在猜测器内。
发明内容
在各种具体实施中,本申请提供了系统、方法和设备,所述系统、方法和设备提供用户接口以有效和方便地配置名称的语音发音。
在一个方面,系统基于用户对名称的单音节组成部分的选择而生成名称的语音发音。该系统可将语音发音与名称相关联。该系统可包括被设置用于接收名称的用户接口。该系统还可包括被设置用于将名称映射到多个单音节组成部分的处理器,所述多个单音节组成部分能够组合以构建名称的语音发音。用户接口还可被设置用于接收用户输入以选择所述多个单音节组成部分中的一个或多个。此外,处理器可被设置用于组合所述多个单音节组成部分中的所选择的一个或多个以构建名称的语音发音。
在一种配置中,用户接口被设置用于向用户提供语音发音。用户接口可被设置用于接收第二用户输入以选择或拒绝所述语音发音。用户接口还可被设置用于向用户显示所述多个单音节组成部分的第一部分。用户接口可进一步被设置用于响应于用户对所述多个单音节组成部分的所述第一部分之一的选择来显示所述单音节组成部分的第二部分。
处理器可被设置用于接收来自联系人应用程序的联系人列表和/或与用户相关联的其他应用程序的名称。该名称可为文本格式。处理器可被设置用于查询数据存储装置和/或数据库,所述数据存储装置和/或数据库包括与名称相关联的单音节组成部分中的一个或多个。单音节组成部分可包括与一种或多种语言、文化和/或地区相关联的组成部分。对名称的语音发音的构建可包括生成音频文件。
在另一个方面,一种用于确定与名称的语音发音相关联的使用信息的系统可包括被设置用于接收一个或多个联系人名称的服务器。该系统可包括被设置用于存储与所述一个或多个名称相关联的一个或多个语音发音的数据存储装置。服务器可被设置用于从一个或多个用户设备接收与所述一个或多个名称相关联的所述一个或多个语音发音的指示,并且确定与和所述一个或多个名称相关联的所述一个或多个语音发音相关联的使用数据。
该指示可包括所述一个或多个语音发音。该指示可包括来自所述一个或多个用户设备的对所述一个或多个语音发音的选择。使用数据可包括所述指示在一段时间期间被接收的实例的量。服务器可被设置用于根据所述使用数据向第一用户设备提供与所述名称相关联的语音发音中的至少一个。
在另一个方面,一种系统可包括和/或设有多个发音猜测器,其中发音猜测器中的每一个与语言或地区的特定语音字母表相关联。例如,语音字母表可为但不限于英语、法语、德语、西班牙语和意大利语。处理器确定与用户相关联的语言或地区,并且将第一语音字母表(例如,英语)与和该用户相关联的语言或地区相关联。可以通过制造商输入、服务提供方输入、用户输入、对与系统的位置相关联的地理区域的检测、对由用户输入的名称和/或其他词的类型的分析等等来确定语言和/或地区。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苹果公司,未经苹果公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380018076.0/2.html,转载请声明来源钻瓜专利网。