[发明专利]一种面向弱监督场景的复杂知识图谱问答方法在审
申请号: | 202210176603.1 | 申请日: | 2022-02-25 |
公开(公告)号: | CN114579721A | 公开(公告)日: | 2022-06-03 |
发明(设计)人: | 陈珂;祝斐然;骆歆远;寿黎但;江大伟;胡天磊;伍赛 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36;G06N3/08 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 邱启旺 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 监督 场景 复杂 知识 图谱 问答 方法 | ||
1.一种面向弱监督场景的复杂知识图谱问答方法,该方法包括以下步骤:
(1)将复杂知识图谱问答分为实体链接和关系预测两个子任务,实体链接子任务将用户问句和知识图谱作为输入,输出链接到知识图谱的实体;关系预测子任务将用户问句和EL识别的核心实体作为输入,输出与问句关联的答案实体;
(2)在不完备标注语料上进行启发式的搜索,得到起始实体到标注答案的转移路径,作为候选路径;
(3)采用自适应路径选择算法筛选出符合问句逻辑的转移路径;
(4)对于所有筛选的转移路径,计算其路径得分p(p∣q),然后将每条路径作为基本单位,加权计算整体的模型损失,共同作用于模型的训练,最后通过优化器最小化整体损失值。
2.根据权利要求1所述的一种新型的面向弱监督场景复杂知识图谱问答方法,其特征在于:所述步骤(1)中,通过实体链接和关系预测两个子任务来解决原任务;实体链接子任务引入了知识图谱的语义及拓扑信息;关系预测子任务引入了图谱三元组表征信息来增强模型表现。
3.根据权利要求1所述的一种新型的面向弱监督场景复杂知识图谱问答方法,其特征在于:所述步骤(1)中,关系预测子任务采用状态转移、逐跳推理的方法来回答复杂多跳问题。
4.根据权利要求1所述的一种新型的面向弱监督场景复杂知识图谱问答方法,其特征在于:所述步骤(2)中,在不完备标注语料中采用DFS和剪枝算法搜索出图谱中所有可能的转移路径。
5.根据权利要求1所述的一种新型的面向弱监督场景复杂知识图谱问答方法,其特征在于:所述步骤(3)中,所述自适应路径选择算法利用RP模型当前的参数对每条路径计算后验概率,筛选出概率最大的路径用于模型的训练。
6.根据权利要求1所述的一种新型的面向弱监督场景复杂知识图谱问答方法,其特征在于:所述步骤(4)中,将多条转移路径共同作用于同一个问句的训练过程中,并用加权的方式来平衡每条路径的对训练过程的贡献。
7.根据权利要求1所述的一种新型的面向弱监督场景的知识图谱问答方法,其特征在于:所述步骤(4)中,基本的评价指标包括精准率P值、召回率R以及F1值:
精准率P=正确预测的答案实体数/预测答案实体总数*100%,
召回率R=正确预测的答案实体数/数据集答案实体总数*100%,
精确率和召回率的调和平均值F1=2PR/(P+R)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210176603.1/1.html,转载请声明来源钻瓜专利网。