[发明专利]一种端到端的基于上下文的知识库问答方法及装置有效

专利信息
申请号: 201910306552.8 申请日: 2019-04-17
公开(公告)号: CN110059160B 公开(公告)日: 2021-02-09
发明(设计)人: 周德宇;林超 申请(专利权)人: 东南大学
主分类号: G06F16/33 分类号: G06F16/33;G06F16/332;G06N3/04
代理公司: 南京苏高专利商标事务所(普通合伙) 32204 代理人: 孟红梅
地址: 211189 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种端到端的基于上下文的知识库问答方法及装置,考虑了知识库中实体和关系的连接关系,使得其包含的实体链接和关系预测两个任务相互促进,共同提升。方法主要包括:对问题进行预处理,去除特殊符号;基于知识库构建与问题相关的候选实体集合,并根据候选实体在知识库中相关联的关系构建候选关系集合;对于每个候选集合中的每个实体,抽取实体在问题中的上下文;对候选关系进行不同粒度的划分;基于CERM模型预测主语实体和谓语关系;利用预测的主语实体和关系在知识库中找到宾语实体作为答案返回。本发明将知识库问答中的实体链接与关系预测融入一个统一的预测模型中,实现了主语实体和关系的联合预测,提高了问答的准确率。
搜索关键词: 一种 端到端 基于 上下文 知识库 问答 方法 装置
【主权项】:
1.一种端到端的基于上下文的知识库问答方法,其特征在于,包括以下步骤:(1)对自然语言问题进行预处理,过滤特殊字符;(2)基于知识库构建与问题相关的候选主语实体集合,并根据候选实体在知识库中相关联的关系构建候选谓语关系集合;(3)对于每个问题的候选主语实体集合中的每个实体,抽取实体在问题中的上下文;(4)对于每个问题的候选谓语关系集合中的每个关系进行不同粒度的划分;(5)基于CERM模型进行训练,通过训练数据学习主语实体的上下文表示和谓语关系的不同粒度的表示,使得正确的实体和正确的关系的相似度更高;在测试阶段,返回候选实体列表和候选关系列表中得分最高主语实体和谓语关系;(6)利用预测的主语实体和谓语关系在知识库中找到宾语实体作为答案返回。所述CERM模型包括:实体编码器单元:利用深度神经网络模型对实体的上下文进行序列建模,将候选实体转化为一个包含问题上下文语义的低维空间的分布式向量;关系编码器单元:将划分后的关系看作一个序列,利用深度神经网络将划分后的关系转化为包含关系语义的一个分布式向量;实体和关系得分列表单元:将一个自然语言问题的候选主语实体和候选谓语关系分别通过所述实体编码器和关系编码器得到的特征向量进行点积运算得到实体和关系的相似度矩阵,对矩阵分别进行行方向和列方向的最大池化操作得到关系相似度得分列表和实体相似度得分列表;实体和关系预测单元:在训练阶段,通过最小化对数归一化指数损失,使得候选实体和候选关系相似度得分列表中正确的实体和关系的得分更高;测试阶段,返回主语实体和谓语关系得分列表中得分最高的实体和关系。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910306552.8/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top