[发明专利]一种基于子问题剪枝的水利知识图谱复杂问答方法在审
申请号: | 202210605035.2 | 申请日: | 2022-05-31 |
公开(公告)号: | CN114996423A | 公开(公告)日: | 2022-09-02 |
发明(设计)人: | 冯钧;李艳;陆佳民 | 申请(专利权)人: | 河海大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/28;G06F16/338 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
地址: | 210024 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 问题 剪枝 水利 知识 图谱 复杂 问答 方法 | ||
本发明公开了一种基于子问题剪枝的水利知识图谱复杂问答方法,步骤如下:将水利知识图谱嵌入到复数空间,对复杂问题进行编码并将其映射到与水利知识图谱相同的嵌入空间中,生成候选答案集;分析复杂问题的句法结构和语义结构并生成依存句法分析树,对复杂问题进行分解,得到问题描述图;识别问题描述图中的子问题的答案类型,运用这些答案类型对候选答案集进行剪枝;计算剪枝后的候选答案集中每个答案的分数,取出最高分数的答案实体作为最终答案返回给用户。本发明有效的缓解了因图谱稀疏问题造成的正确答案丢失问题,有效降低候选答案集范围,在复杂问答上取得更高的精确度。
技术领域
本发明涉及计算机软件,特别是一种基于子问题剪枝的水利知识图谱复杂问答方法。
背景技术
根据知识图谱三元组的个数,自然语言问题可以分为两种:
(1)简单问题,只依赖一个三元组完成问答;
(2)复杂问题,涉及多个本体的多个类及属性或者具有多个约束条件,具有复杂的语义结构和句法结构。
基于知识图谱的复杂问答将用户输入的自然语言问题进行解析,得到问题主题实体,将主题实体链接到知识图谱中,并找到多个关联的三元组以建模多跳长路径,将路径的尾实体作为问题答案返回给用户。目前,基于知识图谱的复杂问答系统已经很好的应用于多垂直行业如金融、医疗、电商等,通过引入知识图谱为用户提供精确、规范的行业数据描述与表达。然而,现有的水利知识图谱存在部分实体缺少知识或者关系路径等问题,图谱具有稀疏性。问答推导过程依赖于知识图谱中关系的连接,会因为图谱的稀疏性导致答案推理过程中,在限定的跳数内构成的候选子图中不存在正确答案的路径,从而无法准确回答用户提出的问题。
基于知识图谱的复杂问答通常需要考虑每个问题以主题实体为中心的子图,但随着跳数的增加,会使得候选答案的数量呈指数增长。目前大多数的复杂问题的问答采用顺序决策的方法。Qiu等人提出可解释的推理机制来逐步获取问题的答案实体,且在此基础上增加注意力机制以保证推理过程的准确性,并采用集束搜索优化查询路径,从而减少候选答案的数量。该方法在回答两跳问题上都取得很大进展,但在回答三跳或具有复杂约束的问题时性能较差,并且在顺序决策过程中会造成错误累积,大大地限制了回答复杂问题的能力。因此,如何有效的过滤无关事实,减少搜索空间是研究的重点。
发明内容
发明目的:本发明的目的是提供一种基于子问题剪枝的水利知识图谱复杂问答方法,从而缓解由于知识图谱不完整导致正确答案找不到的问题,提高问答的精准度。
技术方案:本发明所述的一种基于子问题剪枝的水利知识图谱复杂问答方法,包括以下步骤:
(1)知识图谱嵌入和问题嵌入:知识图谱嵌入,将水利知识图谱嵌入到复数空间,以捕获全面的特征信息;问题嵌入,先将问题进行编码,然后将其映射到与水利知识图谱相同的嵌入空间中;计算问句向量和知识图谱中实体的相似得分,生成候选答案集。
(2)问题分解:对复杂问题的句法结构和语义结构进行详细分析,生成对应的依存句法分析树,根据依存句法分析树与一组规则对复杂问题进行分解,得到问题描述图,该图展示了复杂问题对应的一系列简单的子问题以及子问题的关系。
(3)候选答案集剪枝:识别问题分解步骤中问题描述图中的子问题的答案类型,运用这些答案类型对候选答案集中的所有实体进行剪枝。
(4)答案筛选:计算新的候选答案集中每个答案的分数,取出最高分数的答案实体作为最终答案返回给用户。
所述步骤(1)具体为:
(1.1)针对知识图谱嵌入,定义水利知识图谱中头实体与尾实体h,t∈E和关系r∈R,利用ComplEx方法根据评分函数学习它们在复数空间中的向量表示所有合理的三元组有Φ(h,r,t)0,所有不合理的三元组有Φ(h,r,t)0。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210605035.2/2.html,转载请声明来源钻瓜专利网。