[发明专利]用于实体名称识别的方法和系统有效
申请号: | 201510325104.4 | 申请日: | 2015-06-12 |
公开(公告)号: | CN105206261B | 公开(公告)日: | 2019-10-18 |
发明(设计)人: | G·斯科贝尔特西恩;B·贝扎迪 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G10L15/18 | 分类号: | G10L15/18;G10L15/187;G10L15/08 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 邵亚丽 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实体 名称 识别 | ||
本公开的实施例涉及包括编码在计算机存储介质上的计算机程序的、用于识别语音中的实体的名称的方法、系统和装置。在一个方面,该方法包括:接收话语的动作,该话语包括(i)指示特定的实体类型的第一词语和(ii)指示实体名称的第二词语。附加的动作包括:获得第二词语的语音表示并且确定第二词语的语音表示与关联于特定的实体的规范名称的集合中的特定的规范名称的特定的语音表示匹配。进一步动作:包括将与特定的实体相关联的参考名称输出为第二词语的转录。
本申请要求2015年3月15日提交的美国申请序列号61/013,585和2014年6月18日提交的美国临时申请序列号62/013,585的权益,这些申请通过引用并入。
技术领域
本公开内容总体上涉及语音识别,并且根据一个示例实现方式,涉及识别话语中的专有名称。
背景技术
语音命令可以包括专有名称。例如,用户可以说“Navigate to Pete’s PizzaPalace restaurant”,以便请求自然语言处理系统提供到名称为“Pete’s Pizza Palace”的餐厅的方向。
发明内容
一些语音命令包括可能很难使用常规语音识别器来准确地转录的专有名称。例如,无论用户说的多么清楚,常规语音识别器可能将语音命令“Navigate to CITYZENrestaurant in Washington DC”转录为“Navigate to CITYZEN restaurant inWashington DC”。这样的转录可能导致自然语言处理系统输出错误的或者无意义的结果。
考虑到来自该示例语音命令的正确转录的词语“restaurant”和“Washington”,并且考虑到对应于专有名称的语音命令的部分的语音转录“SI-tee-<>-ze-en”,本说明书中所描述的增强型自然语言处理系统可以通过利用实体名称“CityZen”替换不准确的转录的专有名称“citizen”,来准确地转录语音命令的该部分,该实体名称“CityZen”:(i)匹配“restaurant”实体类型,(ii)与“Washington DC”位置相关联,(iii)与匹配对应于专有名称的语音命令的部分的语音转录的语音表示预关联。如本说明书中所使用的,“实体”可以指代任何人、地点、对象、事件,或者概念。
在一些方面,本说明书中描述的主题可以被实施为方法,该方法可以包括接收话语的动作,该话语包括(i)指示特定实体类型的第一词语和(ii)指示实体名称的第二词语。附加的动作包括获得第二词语的语音表示和确定第二词语的语音表示与关联于特定实体的规范名称集中的特定的规范名称的特定语音表示匹配。进一步动作包括将与特定实体相关联的参考名称输出为第二词语的转录。
其他版本包括对应的系统、装置和被配置为被编码在计算机存储设备上、执行该方法的动作的计算机程序。
这些和其他版本可以每个可选择地包括一个或多个以下特征。例如,在一些实施方式中,对于一个或多个实体中的每一个实体,获得实体的规范名称集中的每个规范名称的语音表示包括:通过将一个或多个发音规则应用到每个规范名称来生成针对每个规范名称的语音表示。
在一些方面,确定第二词语的语音表示与关联于特定实体的规范名称集中的特定规范名称的特定语音表示匹配包括:基于第二词语的语音表示与特定语音表示之间的距离确定匹配得分,并且确定该匹配得分满足预定的阈值匹配得分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510325104.4/2.html,转载请声明来源钻瓜专利网。