[发明专利]一种面向会话式实体搜索的查询扩展方法有效

专利信息
申请号: 201711162771.0 申请日: 2017-11-21
公开(公告)号: CN107943919B 公开(公告)日: 2019-11-12
发明(设计)人: 赵峰;王沛;肖洋;金海 申请(专利权)人: 华中科技大学
主分类号: G06F16/33 分类号: G06F16/33;G06F16/31;G06F16/9535
代理公司: 华中科技大学专利中心 42201 代理人: 廖盈春;李智
地址: 430074 湖北*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开一种面向会话式实体搜索的查询扩展方法,包括:对维基百科文档集预处理得到数据集D;遍历数据集D中每个文档d,得到关键字倒排索引Ik、实体倒排索引Ie以及实体类映射IE;抽取WordNet中的语义信息和YAGO3中的实体相关信息;根据历史查询结果构建历史结果缓存队列L;根据用户本轮查询Q对Ik、Ie和IE进行检索获取伪相关反馈QPRF,利用语义信息和实体相关信息对L中的历史结果进行分析获取历史反馈Qh;基于本轮查询Q、伪相关反馈QPRF和历史反馈Qh生成扩展查询QE,利用QE对Ik、Ie和IE进行重新检索和排序得到最终结果集R;利用R更新缓存队列L。本发明在减少查询开销的同时缩短查询流程。
搜索关键词: 一种 面向 会话 实体 搜索 查询 扩展 方法
【主权项】:
1.一种面向会话式实体搜索的查询扩展方法,其特征在于,包括以下步骤:(1)对维基百科文档集预处理得到包含关键字和实体注释的数据集D;(2)遍历数据集D中每个文档d,对d中包含的关键字和实体进行索引,最终得到关键字倒排索引Ik、实体倒排索引Ie以及实体类映射IE;(3)抽取WordNet中的语义信息和YAGO3中的实体相关信息;(4)根据历史查询结果构建历史结果缓存队列L;(5)根据用户本轮查询Q对Ik、Ie和IE进行检索获取伪相关反馈QPRF,利用步骤(3)中获取的语义信息和实体相关信息对L中的历史结果进行相关性分析获取历史反馈Qh;步骤(5)包含以下子步骤:(5‑1)计算扩展关系模型Mr,若支持文档集ds由输入实体ein、结果实体er、数据集D及扩展关系模型Mr的混合模型生成,则有:其中,logp(ds|Md)表示支持文档集ds在反馈文档模型Md下的相关性得分,W(w,d)表示词条w在文档d中的权重,p(w|ein)表示词条w与输入实体ein的相关性,p(w|er)表示词条w与结果实体er的相关性,p(w|Mr)表示在扩展关系模型Mr下生成词条w的概率,p(w|D)表示在当前数据集D下生成词条w的概率,α1、α2和β均表示[0,1]间的可调参数,通过期望最大化算法对公式中扩展关系模型Mr进行有效估计;(5‑2)从Mr中选取前p项作为伪相关反馈QPRF;(5‑3)计算L中历史结果与输入实体的语义相关性,考虑历史结果与输入实体间是否存在映射关系,给定指示器函数I(ein,er)表示输入实体ein与历史结果er间是否存在映射关系,w(ein,er)表示输入实体ein与历史结果er间的语义强度,则历史结果与输入实体的语义相关性Rsem(er)计算公式如下:其中,ek表示YAGO3中与输入实体ein存在关联的实体;(5‑4)计算L中历史结果与输入实体的上下文相关性,考虑历史结果与输入实体共现的文档越多、历史结果与输入实体间的文本距离越小,两者之间越相关,给定输入实体ein、历史结果er在支持文档d中文本距离为Prox(ein,er,d),则输入实体与历史结果的上下文相关性Rtext(er)计算公式如下:其中,分别表示由支持文档d和本轮查询Q生成的词条向量,表示间的余弦相似度;(5‑5)基于输入实体与历史结果的语义相关性和输入实体与历史结果的上下文相关性,通过线性加权的方式计算历史结果er与本轮查询Q的相关性R(er),计算公式如下:R(er)=αRsem(er)+(1‑α)Rtext(er)其中α为[0,1]间的加权系数;(5‑6)根据相关性R(er)从L中选取前p项作为历史反馈Qh;(6)基于本轮查询Q、伪相关反馈QPRF和历史反馈Qh生成扩展查询QE,利用QE对Ik、Ie和IE进行重新检索和排序得到最终结果集R;(7)利用R更新缓存队列L,若用户提出下轮查询则转至步骤(5),否则进入步骤(8);(8)本次会话查询结束。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201711162771.0/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top