[发明专利]基于知识图谱的问答系统中的处理方法和装置有效

专利信息
申请号: 202010182500.7 申请日: 2020-03-16
公开(公告)号: CN111414465B 公开(公告)日: 2023-09-01
发明(设计)人: 张文剑;牟小峰 申请(专利权)人: 北京明略软件系统有限公司
主分类号: G06F16/332 分类号: G06F16/332;G06F16/36;G06F40/242;G06F40/295
代理公司: 北京安信方达知识产权代理有限公司 11262 代理人: 张建秀;龙洪
地址: 100084 北京市海淀区*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 知识 图谱 问答 系统 中的 处理 方法 装置
【权利要求书】:

1.一种基于知识图谱的问答系统中的处理方法,其特征在于,包括:

在接收到问句后,获取所述问句在预先设置的知识库中对应的主实体;

从所述主实体中选择至少两个候选主实体;

以每个候选主实体为根节点,在预先存储的知识图谱中搜索所述根节点的相邻边以及相邻节点,并通过相邻节点搜索所述相邻节点在下一层的相邻边和相邻节点,以此类推,直到搜索到最后一层的节点,得到每个候选主实体对应的路径;

计算每个候选主实体的路径所对应的文本信息与所述问句的文本信息的相似度;

选择所述相似度符合预先设置的最高相似度判断条件的路径作为候选主实体的候选路径;

从所述候选主实体的候选路径中得到所述主实体的最终选择路径;

确定所述最终选择路径对应的文本信息,作为所述问句的答案;

其中,所述从所述候选主实体的候选路径中得到所述主实体的最终选择路径,包括:

判断所述候选路径的相似度之间的差值是否大于或等于预设的阈值;

如果所述差值大于或等于所述阈值,则选择所述候选路径中相似度最高的路径为最终选择路径;

如果所述差值小于所述阈值,则获取所述候选路径对应的文本信息与所述问句的重叠字数,选择重叠字数最多的路径为最终选择路径。

2.根据权利要求1所述的方法,其特征在于,所述获取所述问句在预先设置的知识库中对应的主实体,包括:

利用预先获取的主实体词典识别所述问句中的主实体提及,得到第一识别结果,其中所述主实体词典包括所述知识库中所有的主体和客体;以及,利用预先获取的主题词识别的深度学习模型,识别所述问句中的主实体提及,得到第二识别结果;

将所述第一识别结果和所述第二识别结果合并为最终的识别结果;

在预先设置的链接词典中存储的主实体提及与知识库中主实体的对应关系,查找所述识别结果中的每个主实体提及对应的知识库中的主实体。

3.根据权利要求1所述的方法,其特征在于,所述从所述主实体中选择至少两个候选主实体,包括:

确定每个主实体的至少两个特征信息;

通过对同一个主实体的特征信息进行识别,得到每个主实体的得分信息;

根据每个主实体的得分信息,选择至少两个候选主实体。

4.根据权利要求1所述的方法,其特征在于:

在所述问句中包括n个主实体时,选择所述n个主实体中一个主实体作为目标主实体,在确定目标主实体的候选主实体后,确定所述目标主实体的目标候选主实体;

其中所述目标候选主实体的候选路径是通过如下方式得到的,包括:

在以每个目标候选主实体为根节点进行相邻边和相邻节点的搜索过程中,在对所述相邻节点在下一层的相邻边和相邻节点的搜索时,利用所述n个主实体中的剩余的(n-1)个主实体进行路径的筛选,得到所述目标候选主实体的候选路径,其中n为大于等于2的整数。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明略软件系统有限公司,未经北京明略软件系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010182500.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top