[发明专利]一种基于互动百科知识的语义逻辑引导的搜索方法有效

专利信息
申请号: 201410086557.1 申请日: 2014-03-11
公开(公告)号: CN103870565B 公开(公告)日: 2017-04-05
发明(设计)人: 何格;顾君忠;兰小敏 申请(专利权)人: 华东师范大学
主分类号: G06F17/30 分类号: G06F17/30;G06F17/27
代理公司: 上海蓝迪专利商标事务所(普通合伙)31215 代理人: 徐筱梅,张翔
地址: 200241 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 互动 百科 知识 语义 逻辑 引导 搜索 方法
【说明书】:

技术领域

发明涉及信息抽取、查询处理、信息检索,具体地说是基于互动百科海量的三元关系组知识集,结合知识匹配算法来引导用户的搜索。

背景技术

信息检索技术包括搜索引擎是人们日常生活中寻找信息的常用工具,尤其是互联网使用的普及化后,搜索引擎成为必不可少的网络应用。

随着互联网信息的海量增长和人们对信息检索的高准确性要求,单单依靠倒排索引和词匹配技术的搜索引擎,在用户输入的查询语句普遍比较短,不能详细而准确描述查询意图的情况下,搜索效果不够理想。尤其是词语的多义问题让搜索效果更加恶化。目前有很多研究从搜索引擎方面如语义消岐、查询扩展、查询日志分析、基于概念的搜索等以及从用户使用角度的公式化查询、用户实时交互、查询处理等在一定程度上提高了搜索引擎的搜索效果。而从用户角度上如何让用户以更直接的更自然的语言输入搜索引擎能有效处理的查询语句的研究还需很大程度上的投入。

发明内容

本发明的目的是从用户角度帮助用户更准确的描述搜索意图,尤其是帮助用户将搜索引擎不能处理的带有语义逻辑的查询语句处理为依靠倒排和词匹配的搜索引擎可以处理的一般逻辑而提供的一种基于互动百科知识的语义逻辑引导的搜索方法,该方法定义了四个语义逻辑符号,用户可以使用这些符号来编辑查询语句,编辑好的查询语句在提交给搜索引擎之前,会先使用从互动百科中抽取的海量三元关系组结合词语相似度的知识匹配和筛选来解析符号逻辑,生成搜索引擎能有效处理的只包含一般的与或非逻辑的查询语句。同时可以返回推荐给用户的其他查询语句。

实现本发明目的的具体技术方案是:

一种基于互动百科知识的语义逻辑引导的搜索方法,其特征在于该方法包括以下具体步骤:

a)将互动百科在线描述的知识数据分为概念、关系和实体三类,根据三类知识之间的关系,形成三元关系组,以三元关系组的形式抽取并存储互动百科的知识;

b)设定四个语义逻辑符号,用户使用四个语义逻辑符号构建查询语句,然后利用三元关系组的特点来处理该查询语句,得到的新的查询语句提交搜索引擎,并将处理得到的其他查询语句推荐给用户;其中,

所述概念具有唯一的语义,为互动百科的标题;关系是概念的属性以及所有与概念有联系的关系的描述;实体不具有唯一的语义,概念的某种关系下对应的是实体或是某个概念;

所述三类知识之间的关系是:概念、实体及两者之间的关系和概念、概念及两者之间的关系;概念、关系及实体形成三元关系组或者概念、概念及两者之间形成三元关系组;

所述以三元关系组的形式抽取互动百科知识是:互动百科网页标题定为该页主概念,该互动百科网页内的信息对-属性、人物关系、从属关系,有冒号两边、从标题及其下属文本规律;信息对分别对应关系和实体或者关系和概念;

所述四个语义逻辑符号是:

“.”从属、构成相关逻辑:根据概念和其相关的关系获取对应的实体或概念集;

“:”相关、定义逻辑:根据概念描述或与概念相关的词来明确该概念;

“^”相关逻辑:根据概念、关系及实体或概念之间的三元关系组的特点,由其中的两元推出第三元;

“~”相似逻辑:使用相似逻辑来筛选数据;

所述使用四个语义逻辑符号构建查询语句,利用三元关系组处理查询语句是:用户使用符号代替自然语言中的逻辑,然后利用三元关系组的特点来处理该逻辑。

本发明将百科知识分为三类数据,通过定义的四个语义逻辑符号,利用从互动百科海量的百科知识中抽取的三元关系组知识集,结合词语相似度的知识匹配,来帮助用户以更自然的语言逻辑构建查询语句,尤其是使用在一般搜索引擎不能处理的相似、相关逻辑,并将此查询语句处理为一般搜索引擎能有效处理的新的查询语句,提高了搜索引擎的搜索精度。同时可以推荐给用户更精确的查询语句,甚至直接返回给用户想要的知识。从而提高了搜索引擎的效率,提高用户查询满意度。

附图说明

图1为本发明的流程图;

图2为本发明中互动百科知识抽取的详细流程。

图3-6为本发明在搜索中四个语义逻辑符号的处理流程图;

图7、图8、图9为实施本发明实施例图。

具体实施方式

语义逻辑符号引导的搜索需要使用语义逻辑符号编辑查询语句,同时需要互动百科里的三元关系组知识集。参阅图1,其中互动百科知识的抽取和语义逻辑符号的定义和处理是重要部分,分别如下所述。

1.互动百科知识的抽取

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学,未经华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410086557.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top