[发明专利]用于信息检索评分的动态张量注意力有效
申请号: | 201780076850.1 | 申请日: | 2017-12-08 |
公开(公告)号: | CN110168575B | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 张耿豪;张若非;殷子 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06F16/33;G06F16/332 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华;丁君军 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 信息 检索 评分 动态 张量 注意力 | ||
一种使用序列到序列神经网络针对文档对查询进行评分的技术。技术包括:接收来自用户的包括多个词语的查询;基于查询,针对包括词语的文档执行搜索;馈送文档的词语作为多层序列到序列转换器的编码器的输入;在多层序列到序列转换器的解码器处生成多个向量,每个向量包括与查询中的相应词语相关联的概率;在相应向量中查找每个词语与文档相关联的概率;将每个词语的概率乘在一起以确定查询与文档相关联的总概率;并且如果查询与文档相关联的总概率大于阈值,则将文档返回给用户。
技术领域
本公开的实施例涉及计算机领域,并且更具体地涉及一种针对文档对查询进行评分的方法、系统和计算机存储介质。
背景技术
理解和处理被包含在表达用户意图的自然语言查询中的信息是文档选择中的主要挑战。以自然语言形式的用户查询通常是模糊并且隐含的,其使通过现有信息检索系统处理困难,这常常要求多个用户交互以用于进一步澄清。此外,为了响应于查询而返回文档,查询和建议文档需要被评分,其中最好评分的建议文档被提供给录入查询的用户。先前的基于深度学习的评分方法(诸如卷积深度结构化语义模型“CDSSM”)允许相对有效地对查询-文档对进行评分,但是得分是基于距离/相似性的。相似性基于两个实体之间的距离。相似性与距离正反比。然而,基于距离/相似性的评分提供关于针对给定查询返回的特定文档的适当性的有限信息。因此,使用基于距离的评分,评分系统可以返回具有最好得分的文档,而不是向查询提供有意义的响应的必要文档。
发明内容
本公开的非限制性示例描绘了一种用于对针对文档对查询进行评分的方法。方法包括:从用户接收包括多个词语的查询;基于查询,针对包括词语的文档执行搜索;将文档的词语馈送为多层序列到序列转换器的编码器的输入;在多层序列到序列转换器的解码器处生成多个向量,每个向量包括与查询中的相应词语相关联的概率;在相应向量中查找每个词语与文档相关联的概率;将每个词语的概率乘在一起以确定查询与文档相关联的总概率;并且如果查询与文档相关联的总概率大于阈值,则将文档返回给用户。
本公开的进一步的非限制性示例描述了一种针对文档对查询进行评分的系统。系统包括:至少一个处理器;以及与至少一个处理器操作地连接的存储器,其存储当由至少一个处理器执行时使得至少一个处理器执行方法的计算机可执行指令,所述方法包括:从用户接收包括多个词语的查询;基于查询,针对包括词语的文档执行搜索;将文档的词语馈送为多层序列到序列转换器的编码器的输入;使用注意力机制在多层序列到序列转换器的解码器处生成多个向量,每个向量包括与查询中的相应词语相关联的概率;在相应向量中查找每个词语与文档相关联的概率;将每个词语的概率乘在一起来确定查询与文档相关联的总概率;并且如果查询与文档相关联的总概率大于阈值,则将文档返回给用户。
附加的非限制性示例包括计算机存储介质,其存储用于使得机器执行以下操作的计算机可执行指令:从用户接收查询;对查询执行搜索;接收由于搜索得到的文档;使用序列到序列转换器和注意力网络对文档进行评分以确定查询与文档有关的概率;并且如果概率大于阈值,则返回文档。
提供本发明内容以引入以在具体实施方式中下面进一步描述的简化形式的概念的选择。本发明内容不旨标识要求保护的主题的关键特征或基本特征,其也不旨在被用于限制要求保护的主题的范围。示例的附加方面、特征和/或优点将从下面的描述中部分地阐述并且部分地从描述变得明显,或者可以通过本公开的实践学习。
附图说明
参考以下附图描述非限制性和非详尽示例。
图1图示了在其中可以实践本公开的方面的查询评分系统的系统图。
图2图示了在其中可以实践本公开的方面的用于针对文档对查询进行评分的序列到序列过程。
图3图示了在其中可以实践本公开的方面的用于通过使用多层序列到序列过程对查询进行评分的过程。
图4图示了示出在其中可以实践本公开的方面的示例的用于通过使用多层序列到序列过程对查询进行评分的过程。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780076850.1/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置