[发明专利]相关段落检索系统有效
申请号: | 201680086072.X | 申请日: | 2016-05-23 |
公开(公告)号: | CN109219811B | 公开(公告)日: | 2022-03-29 |
发明(设计)人: | J·白;Y-S·刘;J·O·彼得森;M·杨;Q·鲁 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 蔡悦;陈斌 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 相关 段落 检索系统 | ||
一种新的架构被提供以支持web规模的精确信息检索系统。该架构提供算法以经由在搜索时捕捉查询和结果内容之间的术语关系的排名模型(例如,语义排名模型、聚合排名模型)来生成候选并选择排名靠前的N个结果。
背景技术
计算系统的用户使用查询来运行对电子对象的搜索。例如,用户在互联网、电子邮件系统、视频存档和其他数据库上运行搜索。随着存储的电子对象的数量增加,搜索电子对象的语料库并将相关结果返回给用户变得越来越具有挑战性。此外,用户越来越期望快速访问与查询相关的信息,而不必访问可由查询返回的各种电子对象。这对于使用移动设备提交的查询而言尤其如此。移动设备的小形状因子使得用户更难以筛选遍历响应于查询而被返回的电子对象。因为这个原因,有益的是提供一种其中对查询的回答被直接提供给用户而不需要用户实际访问电子对象以寻找答案的机制。
本文中所公开的各方面正是就这些和其他一般考虑事项而作出的。而且,尽管可能讨论了相对具体的问题,但是应当理解,各示例不应被限于解决本背景技术中或本公开中其他地方所标识的具体问题。
概述
提供本概述来以简化形式介绍概念的选集,这些概念将在以下详细描述部分中作进一步描述。本概述并不旨在标识出所要求保护的主题的所有关键特征或必要特征,亦非旨在帮助确定所要求保护的主题的范围。
本技术的各方面涉及从用户查询返回结果。例如,用户可提供查询(诸如自然语言查询),从而在web浏览器、电子邮件搜索界面、或云搜索界面、文件系统搜索界面或任何其他类型的搜索界面中搜寻信息。本文中所描述的技术的各方面提供了用于从电子对象(诸如网页、文字处理文档、电子表格、视频等)的语料库中标识高度相关的段落并返回回答用户查询的最相关的(诸)段落的系统和方法。该段落可以直接从电子对象获得,或者可以从来自一个或多个电子对象的多个高排名的段落生成。其他信息可被返回,诸如电子对象中(诸)段落被从其获得的位置。这可以是URL链接、电子邮件链接或其他对象链接。
各示例被实现为计算机进程、计算系统、或者诸如设备、计算机程序产品或计算机可读介质等制品。根据一方面,计算机程序产品是计算机系统可读并对包括用于执行计算机进程的指令的计算机程序进行编码的计算机存储介质。
一个或多个方面的细节在附图和以下描述中被阐明。根据对以下详细描述的阅读和对相关联附图的审阅,其他特征和优点将是显而易见的。要理解的是下面的详细描述仅仅是解释性的,而不是对权利要求的限制。
附图简述
合并在本公开中并构成其一部分的附图解说了各个方面。在附图中:
图1解说了用于从电子对象的语料库中检索相关段落的示例性联网计算环境。
图2解说了用于提供段落的示例性方法。
图3解说了用于基于查询返回相关段落的示例性段落检索系统。
图4解说了相关段落和到示例性电子对象的链接的示例输出。
图5解说了用于标识取决于查询的段落的示例性方法。
图6解说了用于标识文档中的取决于查询的段落的方法。
图7解说了用于基于语义转换模型对段落进行排名的示例性方法。
图8解说了基于查询和样本目标电子对象来标识段落的特征而产生的示例输出。
图9解说了将段落类型与查询类型进行匹配的示例性方法。
图10解说了使用用于将段落类型与查询类型进行匹配的方法所生成的示例输出。
图11解说了基于上下文含义将电子对象与查询进行匹配的示例性方法。
图12提供了基于电子对象的信头将电子对象与查询进行匹配的示例。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680086072.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于3D组件的在线视角搜索
- 下一篇:口语对话系统中的自然语言生成