[发明专利]基于语义理解的知识图谱构建方法、检索方法及其系统在审

专利信息
申请号: 202111117720.2 申请日: 2021-09-24
公开(公告)号: CN113569580A 公开(公告)日: 2021-10-29
发明(设计)人: 万玉晴;聂耀鑫 申请(专利权)人: 太极计算机股份有限公司
主分类号: G06F40/30 分类号: G06F40/30;G06F40/169;G06F16/36;G06F16/35
代理公司: 北京细软智谷知识产权代理有限责任公司 11471 代理人: 石岩
地址: 100020 北京市朝*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 语义 理解 知识 图谱 构建 方法 检索 及其 系统
【说明书】:

本申请涉及一种基于语义理解的知识图谱构建方法、检索方法及其系统。在构建知识图谱时,通过对文档中的语句进行语义识别后对上下位概念进行合并和对语义相近的语句进行剥离,并对不同重要性的语句进行区别标注,从而实现对语义相近或者同一语句表达不同意思的语句有效区分,避免后续检索中出现检索结果不准确的问题,也即可以有效提高检索精度。并且,在进行检索时,可以分别对上位概念、下位概念和具体关键词进行检索,通过多次的限位,使得检索结果更加的精准。

技术领域

本申请涉及知识图谱技术领域,尤其涉及一种基于语义理解的知识图谱构建方法、检索方法及其系统。

背景技术

知识图谱是谷歌及其服务使用的知识库,通过从各种来源收集的信息来增强其搜索引擎的结果,信息显示在搜索结果旁边的信息框中。知识图谱中的信息显示为一个盒子,谷歌称之为“知识面板”,位于搜索结果的右侧(手机顶部),包括世界概况和维基百科,其信息用于回答谷歌助手和谷歌主页语音查询中的直接口头问题。

目前基于知识图谱的检索方法中,在知识图谱的语句的语义相近或者同一语句表达不同意思的情况下,容易出现检索结果不是需要的语句和文章的问题,也即存在检索结果的精准度不够的问题。

发明内容

本申请提供一种基于语义理解的知识图谱构建方法、检索方法及其系统,以解决目前基于知识图谱的检索方法中存在检索结果的精准度不够的问题。

本申请的上述目的是通过以下技术方案实现的:

第一方面,本申请实施例提供一种基于语义理解的知识图谱构建方法,其包括:

获取待构建知识图谱的文档,并对文档中的语句进行提取;

对提取得到的各语句按照主语、谓语和宾语的句子成分进行分割;

对进行分割后的各语句进行关系抽取,包括在进行语义识别后对各语句进行提取和分类,以基于句子成分将上位概念和下位概念进行关联和合并,并将语义相近的语句进行剥离,以及基于各语句的重要性,分别对各语句进行标注;

对进行关系抽取后的各语句分别进行关系识别,以得到各自对应的关系网;

基于所述关系网中的语句,构建知识图谱。

可选的,所述基于所述关系网中的语句,构建知识图谱,之前还包括:

对进行关系识别后得到的所述关系网中的各语句进行注释。

可选的,所述基于所述关系网中的语句,构建知识图谱,之前还包括:

将各语句的注释内容添加到对应语句在文档中的原始位置,并结合上下文对注释内容进行语义校对;

若语义校对的结果表示注释内容存在错误,则修改注释内容,并重新进行语义校对,直至语义校对的结果表示注释内容正确。

可选的,所述基于各语句的重要性,分别对各语句进行标注,包括:

根据语义识别的结果,对所有语句中表示文章的中心思想的语句进行标注,以及对剩余语句进行标注。

第二方面,本申请实施例还提供一种基于知识图谱的检索方法,其中,所述知识图谱为采用第一方面任一项所述的方法构建得到的,所述方法包括:

分别获取用户输入的第一检索词、第二检索词和第三检索词;所述第一检索词用于检索上位概念,所述第二检索词用于检索下位概念,所述第三检索词用于检索具体关键词;

基于所述第一检索词、第二检索词和第三检索词生成并输出检索指令,以基于所述检索指令,利用所述知识图谱进行检索。

第三方面,本申请实施例还提供一种基于语义理解的知识图谱系统,其包括:

文档录入模块,用于获取待构建知识图谱的文档;

语句提取模块,用于对所述文档录入模块获取的文档中的语句进行提取;

语句分割模块,用于对所述语句提取模块提取得到的各语句按照主语、谓语和宾语的句子成分进行分割;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于太极计算机股份有限公司,未经太极计算机股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111117720.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top