[发明专利]基于知识图嵌入的问题回答在审
| 申请号: | 201911148232.0 | 申请日: | 2019-11-21 |
| 公开(公告)号: | CN111506714A | 公开(公告)日: | 2020-08-07 |
| 发明(设计)人: | 张婧媛;李定成;李平;黄啸 | 申请(专利权)人: | 百度(美国)有限责任公司 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06F16/36 |
| 代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 马晓亚;王艳春 |
| 地址: | 美国加利*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 知识 嵌入 问题 回答 | ||
本文描述了使用基于知识嵌入的问题回答(KEQA)框架在知识图上回答问题的实施方式。KEQA实施方式的目标不是直接推断输入问题的头部实体和谓词,而是在KG嵌入空间中联合恢复问题的头部实体、谓词和尾部实体表示。在实施方式中,使用结合各种损失项的联合距离度量来测量预测事实到所有候选事实的距离。在实施方式中,返回具有最小距离的事实作为答案。还公开了联合训练策略的实施方式以获得更好的性能。对各种数据集的性能评估证明了所公开的使用KEQA框架的系统和方法的有效性。
技术领域
本公开总体上涉及用于问题回答的系统和方法。更具体地说,本 公开涉及用于通过知识图回答问题的系统和方法。
背景技术
知识图问题回答(QA-KG)旨在利用知识图(KG)中的事实来回 答自然语言问题。它有助于最终用户更高效、更方便地访问KG中重 要而有价值的知识,而无需了解其数据结构。QA-KG是非常重要的问 题,因为捕捉自然语言的语义对于机器来说是很困难的。已经提出了 许多知识图嵌入方法。一个关键的想法是将每个谓词/实体表示为低维 向量,这样KG中的关系信息可以被保留。然而,这仍然是一项具有 挑战性的任务,因为谓词在自然语言问题中可以以不同的方式表达。 此外,实体名称和部分名称的模糊性使得可能的答案数量很大。
因此,需要能够用来使基于知识图的问题回答更有效和更鲁棒的 系统和方法。
发明内容
根据本申请的一个方面,公开了一种使用一个或多个处理器进行 问题回答的由计算机实施的方法,所述处理器使得执行步骤,所述步 骤包括:使用谓词学习模型在知识图谓词嵌入空间中生成用于包括一 个或多个令牌的问题的预测谓词表示;使用头部实体学习模型,在知 识图实体嵌入空间中生成用于所述问题的预测头部实体表示;基于关 系函数,从所述预测谓词表示和所述预测头部实体表示获取预测尾部 实体表示,所述预测谓词表示、所述预测头部实体表示和所述预测尾 部实体表示形成预测事实,所述关系函数针对知识图嵌入空间中的事 实将头部实体表示和谓词表示与尾部实体表示关联;使用头部实体检 测模型识别用于所述问题的一个或多个预测头部实体名称,每个预测 头部实体名称包括来自所述问题的一个或多个令牌;在所述知识图中 搜索与所述一个或多个预测头部实体名称相关的头部实体同义词;构 建包括一个或多个候选事实的候选事实集,每个候选事实包括所述头 部实体同义词中的头部实体;以及基于联合距离度量,选择所述候选事实集中与所述预测事实具有最小联合距离的一个候选事实作为所述 问题的答案。
根据本申请的另一方面,公开了一种使用一个或多个处理器进行 问题回答的由计算机实施的方法,所述一个或多个处理器使得执行步 骤,所述步骤包括:使用存储在一个或多个计算设备的一个或多个存 储器中的谓词学习模型,在谓词嵌入空间中生成用于包括一个或多个 令牌的问题的预测谓词表示,所述谓词学习模型使用具有真实事实的 训练数据和谓词目标函数进行预训练;使用存储在一个或多个计算设 备的一个或多个存储器中的头部实体学习模型,在实体嵌入空间中生 成用于所述问题的预测头部实体表示,头部实体学习模型使用具有真 实事实的训练数据和头部实体目标函数进行预训练;使用基于知识图 嵌入的关系函数,从所述预测谓词表示和所述预测头部实体表示识别 预测尾部实体表示,所述预测头部实体表示、所述预测谓词表示和所 述预测尾部实体表示形成预测事实;以及基于联合距离度量,从所述 知识图中的事实的至少一个子集中选择事实作为所述问题的答案,所 选择的事实根据所述联合距离度量在其与所述预测事实之间具有最小联合距离。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度(美国)有限责任公司,未经百度(美国)有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911148232.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可调整制冷剂流量的空调系统
- 下一篇:一种提高细胞脂质体转染效率的方法





