[发明专利]一种面向知识库问答的模板自动生成方法有效
申请号: | 201910604477.3 | 申请日: | 2019-07-05 |
公开(公告)号: | CN110532358B | 公开(公告)日: | 2023-08-22 |
发明(设计)人: | 李慧颖;徐泽建;赵畅;陈永锐 | 申请(专利权)人: | 东南大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 叶涓涓 |
地址: | 211189 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供的一种面向知识库问答的模板自动生成方法,包括关系词典构建过程,以及根据问题答案对自动生成问题模板和查询模板的过程。其中,关系词典构建过程是在大量语料的基础上,构建将自然语言短语对应到知识库关系的关系词典。根据问题答案对自动生成问题模板和查询模板的过程首先根据问题答案对,从知识库中获得查询图,将自然语言问题与查询图对齐,在对齐的基础上,自动生成问题模板和查询模板。本发明不依赖人工构建模板,能够解决知识库问答的模板自动生成问题,模板生成过程自动、高效,解决了传统人工模板构建方法的模板生成成本高、模板数量有限的问题,便于一系列后继应用(如自然语言知识库问答)的开展。 | ||
搜索关键词: | 一种 面向 知识库 问答 模板 自动 生成 方法 | ||
【主权项】:
1.一种面向知识库问答的模板自动生成方法,其特征在于,包括以下步骤:/n步骤1,关系词典构建/n从带标注的文本语料中得到若干半结构化信息;给定语料中的句子,如果该句子含有且仅含有两个实体提及m1和m2,且两个实体提及之间的短语p不超过四个单词,同时在知识库中两个实体提及对应的实体e1和e2之间存在关系r,则得到短语p与关系r的映射f;以映射f在语料中出现的次数除以短语p在语料中出现的次数作为该映射的置信度;从语料中得到所有的映射及其置信度构成关系词典;/n步骤2,查询图构建/n根据问题答案对,在知识库中搜索包括问题实体和答案实体的最小连通图,将连通图中的CVT节点替换为变量节点,将答案实体也替换为变量节点,得到查询图;/n步骤3,将自然语言问题与查询图对齐/n寻找自然语言问题和查询图之间的映射,首先根据实体链接结果进行实体对齐,将问题中实体提及与查询图中实体节点对齐;然后去除问题中所有实体提及,保留问题中其他词语;根据问题中其他词语以及查询图中关系,查询关系词典,若词条中关系与查询图中关系完全一致,且词条中短语是问题词语的子序列,则认为问题中的短语与关系之间存在映射,映射的置信度为该词条的置信度,将问题中词语与查询图中关系对齐;/n步骤4,问题模板和查询模板自动生成/n对问题做依存句法分析和词性标注,得到句法依存树,抽取句法依存树中包含实体提及和关系提及的最小子树,使用词性标签代替原有词生成问题模板;/n在步骤2构建的查询图基础上,用步骤3中的对齐标签代替具体的关系和实体,生成查询模板;/n将问题模板与查询模板一起加入模板库。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910604477.3/,转载请声明来源钻瓜专利网。