[发明专利]一种面向对话式知识图谱问答的问题重写方法及设备在审
| 申请号: | 202211348452.X | 申请日: | 2022-10-31 |
| 公开(公告)号: | CN116127085A | 公开(公告)日: | 2023-05-16 |
| 发明(设计)人: | 张鹏;张静;柯习睿 | 申请(专利权)人: | 北京智谱华章科技有限公司 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/30;G06F18/214 |
| 代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张润 |
| 地址: | 100084 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 面向 对话 知识 图谱 问答 问题 重写 方法 设备 | ||
本发明提出一种面向对话式知识图谱问答的问题重写方法及设备,该方法构建了问题重写‑问题推理框架,首先根据会话历史生成一个完整的重写问题,然后通过现有的单轮知识图谱问答模型来推理答案。为了克服目标数据集上重写问题监督信号的缺失,该框架引入了一种知识增强的自训练机制,将问题重写器从另一个数据集迁移到当前的知识图谱和数据集上。该框架中的问题重写器与后续的问题推理过程分离,这使得问题重写器很容易与基于检索或基于语义解析的单轮知识图谱问答模型相结合。实验结果证明了该方法的有效性,并在对话式知识图谱问答数据集ConvQuestions上获得了最先进的结果。
技术领域
本发明涉及机器学习技术领域,尤其涉及一种面向对话式知识图谱问答的问题重写方法、装置、设备、存储介质。
背景技术
近年来,在线客户服务系统和智能个人助理等会话应用的兴起促进了对话式知识图谱问答的发展。与传统的单轮知识图谱问答不同,对话式知识图谱问答通常围绕一个主题进行多轮问答,从而导致了对话中存在的省略和共指等问题。这对处理完整明确问题的单轮知识图谱问答系统提出了巨大挑战。
由于大规模知识图谱(KBs)的出现,知识图谱问答(KBQA)已成为最近的研究热点,如Wikidata、Freebase,以及一些领域知识库,如亚马逊产品知识库和学术知识库。KBQA为用户提供了一种更简单的方法来寻找事实知识,即以自然语言的形式提问而不用关注知识图谱的底层结构如何。然而,通常情况下,人们倾向于从一个话题开始,以对话的方式通过后续问题来进行探讨,而不是单轮的KBQA。特别是,在在线客户服务系统和智能个人助理等实用会话应用的兴起的推动下对话式KBQA(ConvKBQA)受到了越来越多的关注。
ConvKBQA对现有的QA系统提出了巨大的挑战,因为这些系统的目标是一次处理一个独立完整的问题。而在对话场景下,后续问题通常是不完整的,缺少实体,这被称为省略和共指现象。ConvKBQA的相关工作主要分为以下三个方面:
单轮知识图谱问答,单轮KBQA分为两种主流方法,基于检索的方法和基于语义解析的方法。前者通常将知识库中的实体和关系以及问题编码到统一的嵌入空间中,并在此基础上推断答案。最近,这些方法通常限制为从主题实体扩展的问题相关子图。后者并不表示知识图谱和问题,而是将问题解析为逻辑形式,可以在知识图谱上执行以获得答案。中间逻辑形式的类型可以是多种多样的,例如SPARQL、框架语法以及KoPL编程语言。
对话式知识图谱问答,ConvKBQA遵循传统的单轮KBQA系统,也可以分为基于检索和基于语义解析的方法。与单轮KBQA不同,这里的关键是处理省略和共指问题。前者通常识别每轮对话问题的主题实体,然后检索子图进行答案推理。主要区别在于如何识别主题实体。例如,构建实体转换图,并应用图神经网络来推导主题实体分布,或者定义四个启发式度量来估计此类分布。基于语义解析的方法也将每轮对话的问题解析为类似于单轮KBQA的逻辑形式,但困难在于待解析问题的不完整性。因此,它们使用对话历史以及额外的知识图谱信息来扩充模型输入,以解析出更正确的逻辑形式。但同时,它不可避免地引入额外的噪声,这可能会影响解析性能。
对话式问答,ConvQA对非结构化文本数据而不是结构化知识图谱执行对话式QA。因此,与ConvKBQA不同,ConvQA通常对文本数据执行问题重写、文档检索和阅读理解。此外,ConvQA中的对话比ConvKBQA中更口语化,这种差异阻碍了直接使用ConvQA中的标注数据来训练ConvKBQA模型。
发明内容
本发明提供一种面向对话式知识图谱问答的问题重写方法、装置、设备、存储介质,旨在将问题重写过程与问题推理过程分离,使得问题重写很容易与基于检索或基于语义解析的单轮知识图谱问答模型相结合。
为此,本发明的第一个目的在于提出一种面向对话式知识图谱问答的问题重写方法,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京智谱华章科技有限公司,未经北京智谱华章科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211348452.X/2.html,转载请声明来源钻瓜专利网。





