[发明专利]用于实体名称识别的方法和系统有效
申请号: | 201510325104.4 | 申请日: | 2015-06-12 |
公开(公告)号: | CN105206261B | 公开(公告)日: | 2019-10-18 |
发明(设计)人: | G·斯科贝尔特西恩;B·贝扎迪 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G10L15/18 | 分类号: | G10L15/18;G10L15/187;G10L15/08 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 邵亚丽 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实体 名称 识别 | ||
1.一种用于实体名称识别的计算机实现的方法,所述方法包括:
访问实体的目录,对于每个实体,所述实体的目录指示:(i)所述实体的参考名称,(ii)与所述实体相关联的实体类型,以及(iii)与所述实体相关联的地理位置;
为所述实体中的一个或多个实体中的每个实体获得所述实体的多个名称,其中所述实体的所述多个名称是所述实体可由其引用的名称的集合并且包括所述实体的所述参考名称;
为所述一个或多个实体中的每个实体获得所述实体的所述多个名称中的每个名称的语音表示;
选择特定的地理区域和特定的实体类型;
从所述目录选择(i)具有与所述特定的实体类型匹配的实体类型并且(ii)具有与所述特定的地理区域匹配的地理位置的实体;
在实体类型特定的、地理定位的实体数据库中为选择的实体中的每个实体生成记录,其中,对于选择的实体中的每个实体,所述记录至少指示:(i)选择的实体的参考名称,(ii)选择的实体的多个名称中的每个名称的相应的语音表示;
接收包括(i)指示所述特定的实体类型的第一词语以及(ii)指示实体名称的第二词语的话语;
确定所述话语的候选转录,所述候选转录包括对应于所述第一词语的类型词语和对应于所述第二词语的名称词语;
确定对应于所述话语的地理位置;以及
确定所述名称词语与对应于所述类型词语的所述实体类型并且位于与对应于所述话语的所述地理位置匹配的地理位置的实体的参考名称不匹配;
响应于确定所述名称词语与对应于所述类型词语的所述实体类型并且位于与对应于所述话语的所述地理位置匹配的所述地理位置的所述实体的所述参考名称不匹配,获得所述第二词语的语音表示;以及
确定所述第二词语的所述语音表示与关联于特定的实体的、所述特定的实体可由其引用的特定的名称的特定的语音表示匹配;并且
响应于确定所述第二词语的所述语音表示与关联于所述特定的实体的所述特定的名称的所述特定的语音表示匹配,利用特定的实体的参考名称替换候选转录中的名称词语以生成输出转录,并输出所述输出转录。
2.根据权利要求1所述的方法,其中为所述一个或多个实体中的每个实体获得所述实体可由其引用的所述名称的集合中的多个名称中的每个名称的语音表示包括:
通过将一种或多种发音规则应用到所述实体可由其引用的多个名称中的每个名称来生成用于多个名称中的每个名称的所述语音表示。
3.根据权利要求1所述的方法,其中确定所述第二词语的所述语音表示与所述特定实体可由其引用的特定的名称的特定的语音表示匹配包括:
基于所述第二词语的所述语音表示与所述特定的语音表示之间的距离来确定匹配得分;以及
确定所述匹配得分满足预定的阈值匹配得分。
4.根据权利要求1所述的方法,其中确定对应于所述话语的地理位置包括:
确定所述候选转录中对应于所述地理位置的词语。
5.根据权利要求1所述的方法,其中确定对应于所述话语的地理位置包括:
确定在其中话语被说出的位置。
6.根据权利要求1所述的方法,其中获得所述第二词语的语音表示包括:
通过将一种或多种发音规则应用到所述名称词语来生成所述第二词语的所述语音表示。
7.根据权利要求1所述的方法,其中参考名称包括官方名称并且多个名称包括官方名称或非官方名称。
8.根据权利要求1所述的方法,其中实体包括人、地点、对象、事件或者概念中的至少一项。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510325104.4/1.html,转载请声明来源钻瓜专利网。