[发明专利]相关段落检索系统有效
申请号: | 201680086072.X | 申请日: | 2016-05-23 |
公开(公告)号: | CN109219811B | 公开(公告)日: | 2022-03-29 |
发明(设计)人: | J·白;Y-S·刘;J·O·彼得森;M·杨;Q·鲁 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 蔡悦;陈斌 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 相关 段落 检索系统 | ||
1.一种用于相关段落检索的计算机实现的方法,包括:
接收基于互联网的查询;
基于所接收的查询使用搜索引擎标识用于段落提取的电子对象的语料库;
从每个所标识的电子对象中提取段落;
基于所接收的查询对所述电子对象的每一者中的所提取的段落进行排名,以产生每个电子对象的排名靠前的段落;
聚合每个电子对象的所述排名靠前的段落,以形成经聚合的段落;
对所述经聚合的段落进行排名以形成经排名的经聚合的段落;
从所述经排名的经聚合的段落中选择至少一个排名靠前的段落;
返回所述至少一个排名靠前的段落。
2.根据权利要求1所述的计算机实现的方法,其特征在于,所述电子对象是电子邮件、网页、图像、音频文件、视频或文档之一。
3.根据权利要求1所述的计算机实现的方法,其特征在于,对所述排名靠前的段落进行排名包括:
解析所述查询以确定查询信息,其中所述查询信息包括以下各项中的至少一者:
查询语义含义;
查询关键词;以及
查询实体;
解析所述段落以确定段落信息,其中所述段落信息包括以下各项中的至少一者:
段落语义含义;
段落关键词;以及
段落实体;以及
利用各种语义特征生成机器学习段落排名模型,包括使用所述查询信息和所述段落信息的语义转换模型。
4.根据权利要求1所述的计算机实现的方法,其特征在于,进一步包括提供到从中检索到所述段落的所述电子对象的链接。
5.根据权利要求4所述的计算机实现的方法,其特征在于,所述段落和所述链接被提供给客户端设备。
6.根据权利要求5所述的计算机实现的方法,其特征在于,所述查询被接收自所述客户端设备。
7.根据权利要求1所述的计算机实现的方法,其特征在于,所述电子对象的语料库被储存在分布式网络中。
8.一种用于相关段落检索的计算机实现的方法,包括:
接收查询;
至少基于所述查询确定意图;
响应于确定所述意图,使用搜索引擎执行搜索以生成搜索结果,其中所述搜索结果包括根据排名被排序的网页;
分析来自所述经排名的搜索结果的至少一个子集的每一者的多个段落,以产生每个网页的多个排名靠前的结果;
聚合所述经排名的搜索结果的所述子集的每个网页的所述排名靠前的结果;
对经聚合的排名靠前的结果进行排名,以标识至少一个排名靠前的段落;
提供所述至少一个排名靠前的段落。
9.根据权利要求8所述的计算机实现的方法,其特征在于,对所述网页的至少一者的段落进行排名包括:
使用机器学习模型分析所述查询以确定所述查询的语义意图;
使用所述机器学习模型分析所述段落;
利用各种语义特征生成机器学习段落排名模型,包括使用所述查询信息和所述段落信息的语义转换模型;以及
基于数值分数将所述段落按排序置于所述多个段落的其他段落中。
10.根据权利要求8所述的计算机实现的方法,其特征在于,电子对象是电子邮件、网页、音频、图像、视频或文档之一。
11.根据权利要求8所述的计算机实现的方法,其特征在于,进一步包括提供到包含所述至少一个排名靠前的段落的所述网页的链接。
12.根据权利要求11所述的计算机实现的方法,其特征在于,所述链接被返回到客户端设备。
13.根据权利要求12所述的计算机实现的方法,其特征在于,所述查询被接收自所述客户端设备。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201680086072.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于3D组件的在线视角搜索
- 下一篇:口语对话系统中的自然语言生成