[发明专利]一种端到端的基于上下文的知识库问答方法及装置有效

申请号：	201910306552.8	申请日：	2019-04-17
公开（公告）号：	CN110059160B	公开（公告）日：	2021-02-09
发明（设计）人：	周德宇;林超	申请（专利权）人：	东南大学
主分类号：	G06F16/33	分类号：	G06F16/33;G06F16/332;G06N3/04
代理公司：	南京苏高专利商标事务所(普通合伙) 32204	代理人：	孟红梅
地址：	211189 江***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种端到端的基于上下文的知识库问答方法及装置，考虑了知识库中实体和关系的连接关系，使得其包含的实体链接和关系预测两个任务相互促进，共同提升。方法主要包括：对问题进行预处理，去除特殊符号；基于知识库构建与问题相关的候选实体集合，并根据候选实体在知识库中相关联的关系构建候选关系集合；对于每个候选集合中的每个实体，抽取实体在问题中的上下文；对候选关系进行不同粒度的划分；基于CERM模型预测主语实体和谓语关系；利用预测的主语实体和关系在知识库中找到宾语实体作为答案返回。本发明将知识库问答中的实体链接与关系预测融入一个统一的预测模型中，实现了主语实体和关系的联合预测，提高了问答的准确率。
搜索关键词：	一种端到端基于上下文知识库问答方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种端到端的基于上下文的知识库问答方法,其特征在于，包括以下步骤：(1)对自然语言问题进行预处理，过滤特殊字符；(2)基于知识库构建与问题相关的候选主语实体集合，并根据候选实体在知识库中相关联的关系构建候选谓语关系集合；(3)对于每个问题的候选主语实体集合中的每个实体，抽取实体在问题中的上下文；(4)对于每个问题的候选谓语关系集合中的每个关系进行不同粒度的划分；(5)基于CERM模型进行训练，通过训练数据学习主语实体的上下文表示和谓语关系的不同粒度的表示，使得正确的实体和正确的关系的相似度更高；在测试阶段，返回候选实体列表和候选关系列表中得分最高主语实体和谓语关系；(6)利用预测的主语实体和谓语关系在知识库中找到宾语实体作为答案返回。所述CERM模型包括：实体编码器单元：利用深度神经网络模型对实体的上下文进行序列建模，将候选实体转化为一个包含问题上下文语义的低维空间的分布式向量；关系编码器单元：将划分后的关系看作一个序列，利用深度神经网络将划分后的关系转化为包含关系语义的一个分布式向量；实体和关系得分列表单元：将一个自然语言问题的候选主语实体和候选谓语关系分别通过所述实体编码器和关系编码器得到的特征向量进行点积运算得到实体和关系的相似度矩阵，对矩阵分别进行行方向和列方向的最大池化操作得到关系相似度得分列表和实体相似度得分列表；实体和关系预测单元：在训练阶段，通过最小化对数归一化指数损失，使得候选实体和候选关系相似度得分列表中正确的实体和关系的得分更高；测试阶段，返回主语实体和谓语关系得分列表中得分最高的实体和关系。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于东南大学，未经东南大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910306552.8/，转载请声明来源钻瓜专利网。

上一篇：一种近似商标实时监控系统
下一篇：一种基于文本分类技术的电话语音机器人系统

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种端到端的基于上下文的知识库问答方法及装置有效

专利文献下载