[发明专利]实体卡的实体检测和提取有效
申请号: | 201110164789.0 | 申请日: | 2011-06-09 |
公开(公告)号: | CN102393840B | 公开(公告)日: | 2017-01-18 |
发明(设计)人: | F·拉德林斯基;N·克拉斯韦尔;B·比勒贝克;M·绍库希;S·阿哈里;N·阿格拉沃尔;T·霍德;S·周;M·A·阿万 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 永新专利商标代理有限公司72002 | 代理人: | 王英 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及实体卡的实体检测和提取。提供了用于检测包含在搜索结果内的实体信息的系统和方法。可使用所检测的实体信息来确定搜索结果内的实体类别以及具体实体。可从与搜索结果相关联的文档中提取实体信息。这一信息可被用作实体卡的信息的一部分,可向用户显示该信息结合搜索结果和/或代替搜索结果。 | ||
搜索关键词: | 实体 检测 提取 | ||
【主权项】:
一种用于确定与搜索查询相关联的实体的方法,所述方法包括:获得响应于搜索查询的多个结果(310);将所述多个结果的响应结果匹配到对应于面向类别的站点的多个类别模板(320),所述类别模板包括用于对应的面向类别的站点的呈现格式,所述面向类别的站点被定义为跟踪实体类别中的多个实体的状态的站点;基于匹配所述多个类别模板的响应结果来分配从多个实体类别中所选的实体类别(330);基于实体所属的所分配的实体类别以及从所匹配的响应结果提取的至少一个数据字段来标识实体(340),所述至少一个数据字段是使用所述多个类别模板的提取格式组件来提取的,所述至少一个数据字段不同于URL组件;检索存储的关于所标识的实体的实体信息(350);将所检索的实体信息以及至少一个响应结果合并到实体卡中(360);在搜索结果列表中显示所述响应结果(370),所述搜索结果列表不包括至少一个所合并的响应结果;以及显示所述实体卡(380);其中分配实体类别包括:基于匹配所述多个类别模板的特定一个类别模板的响应结果的数量来生成多个实体类别的类别分数;以及基于所述多个实体类别的具有最高类别分数来分配所述实体类别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110164789.0/,转载请声明来源钻瓜专利网。