[发明专利]一种面向5W问答的基于数据图谱、信息图谱、知识图谱和智慧图谱的推荐引擎设计方法在审
申请号: | 201710363378.1 | 申请日: | 2017-05-22 |
公开(公告)号: | CN107977393A | 公开(公告)日: | 2018-05-01 |
发明(设计)人: | 段玉聪;邵礼旭 | 申请(专利权)人: | 海南大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06N99/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 570228 海*** | 国省代码: | 海南;46 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 问答 基于 数据 图谱 信息 知识 智慧 推荐 引擎 设计 方法 | ||
技术领域
本发明是一种面向5W问答的基于数据图谱、信息图谱、知识图谱和智慧图谱的推荐引擎设计方法。主要用于通过查询图谱回答用户使用自然语言提出的问题,属于分布式计算和软件工程学技术交叉领域。
背景技术
知识图谱于2012年5月17日被Google正式提出,其初衷是为了提高搜索引擎的能力,增强用户的搜索质量以及搜索体验。目前,随着智能信息服务应用的不断发展,知识图谱已被广泛应用于智能搜索、智能问答、个性化推荐等领域。尤其是在智能搜索中,用户的搜索请求不再局限于简单的关键词匹配,用户的信息需求仅仅通过关键字是不能被完整表达的。自然语言问题是制定信息需求最直观的方式,人们可以通过提出问题来表达他们的信息需求。问题可用于表达不能表达为关键字的复杂信息需求,并且不会在结构和语义上产生重大损失。知识图谱具有丰富的自然语义,可以包含各种更完整的信息,其表达机制更接近于自然语言,能以图形化的方式向用户展示经过分类整理的结构化知识,从而使用户从人工过滤网页寻找答案的模式中解脱出来。我们提出在数据、信息、知识和智慧层面上澄清知识图谱的整体表达,分别使用数据图谱、信息图谱、知识图谱和智慧图谱来解决5W问题。
在本发明做出之前,已有的智能语义搜索应用中,当用户发起查询时,搜索引擎会借助知识图谱的帮助对用户查询的关键字进行解析和推理,进而将其映射到知识图谱中的一个或一组概念之上,然后根据知识图谱中的概念层次结构,向用户返回知识卡片,其中包括指向资源页面的超链接信息。在深度问答应用中,系统同样会首先在知识图谱的帮助下对用户使用自然语言提出的问题进行语义分析和语法分析,进而将其转化成结构化形式的查询语句,然后在知识图谱中查询答案。我们将用户提出的问题根据疑问词的不同进行分类,由“谁(who)、什么时候(when)、什么地点(where)”等疑问词引导的问题将在数据图谱上进行遍历查找答案,由“什么(what)”引导的问题在信息图谱上查找答案,由“如何(how)”引导的问题在知识图谱上查找答案,由“为什么(why)”引导的问题在智慧图谱上查找答案。
发明内容
技术问题:本发明的目的是提供一种面向5W问答的基于数据图谱、信息图谱、知识图谱和智慧图谱的推荐引擎设计方法,用于解决当前用户信息需求变得复杂,仅仅通过关键词查询效率低下的问题,对由5W引导的问题我们限定是最基本的问题类型,不涉及5W问题之间的转换。本发明可显著地提高用户查询的查全率和查准率。
技术方案:一种面向5W问答的基于数据图谱、信息图谱、知识图谱和智慧图谱的推荐引擎设计方法,其步骤如下所示。
1.构建问题模式库。将用户用自然语言提出的问题根据疑问词的不同划分为:a)由谁(who)或什么时候(when)或什么地点(where)引导的问题;b)由什么(what)引导的问题;c)由如何(how)引导的问题;d)由为什么(why)引导的问题。
2. 对用户提出的问题进行分词,从而确定问题类型。
3. 根据问题的类型,选择在哪种图谱上进行遍历查找答案。
(1)基于数据图谱回答由谁(who)或什么时候(when)或什么地点(where)引导的问题。利用对齐规则将用户提出的问题中的(疑问词,关系词,实体)映射到数据图谱中相关的(主体,关系词,客体),形成精确的查询语句,利用该查询语句得到答案。
(2)基于信息图谱回答由什么(what)引导的问题:
a)通过大量数据集训练,得出划分实体类型的规则;将用户问题中的实体属性与信息图谱中实体属性相匹配,计算相似度,将相似度最高的实体作为答案返回给用户;
b)在信息图谱上若无法直接找到答案,可以通过信息推理建立两个实体间的关系,增加图谱边密度,新建立的关系的正确度Cr是可计算的,P表示实体1和实体2之间的一条路径,Q表示所有路径,表示训练权重:
;
c)信息图谱还能根据用户的问题进行相应的语义扩展,以返回更多用户关心的信息,进一步提高查全率和查准率。
(3)基于知识图谱回答由如何(how)引导的问题:
由如何(how)引导的问题,答案通常是以类似流程图的形式给出,因此我们在知识图谱上找到问题中的相关实体后,通过路径查询,将相邻的实体和关系词进行桥接。
(4)基于智慧图谱回答由为什么(why)引导的问题:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海南大学,未经海南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710363378.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:信息处理装置
- 下一篇:用于安全的盘访问控制的方法和系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置