[发明专利]一种基于语义解析和SMT求解的阅读理解题求解方法有效
| 申请号: | 201810507874.4 | 申请日: | 2018-05-24 |
| 公开(公告)号: | CN108829666B | 公开(公告)日: | 2021-11-26 |
| 发明(设计)人: | 刘咏梅;杨宇灏 | 申请(专利权)人: | 中山大学 |
| 主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/253;G06F40/211 |
| 代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林瑞云 |
| 地址: | 510000 *** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 语义 解析 smt 求解 阅读 理解 方法 | ||
本发明提出一种基于语义解析和SMT求解的阅读理解题求解方法。该方法首先对阅读理解题进行语义解析,继而生成与阅读理解题对应的一阶逻辑公式,再引入四个假设——唯一名称假设、封闭世界假设、封闭原因假设和唯一答案假设来生成额外的一阶逻辑公式。这两部分一阶逻辑公式构成了表达阅读理解题所包含信息的知识库。再根据阅读理解题中的问句来生成候选答案对应的一阶逻辑公式。最后,该方法使用SMT求解器来验证知识库是否蕴涵候选答案对应的一阶逻辑公式,继而求出答案。相比已有的使用神经网络模型和词向量来表达文本的方式,本发明能更好地建立起阅读理解题中所描述的事件之间的关系,从而赋予了阅读理解系统更强的表达能力和推理能力。
技术领域
本发明涉及计算机领域,具体涉及一种基于语义解析和SMT(SatisfiabilityModulo Theories)求解的阅读理解题求解方法。
背景技术
对于机器来说,阅读一段文本然后回答与该文本相关的问题,是一项具有挑战性的任务。一个机器只有具有了对文本进行阅读理解和推理求解的能力,它才能完成该任务。为了检验机器阅读理解和推理求解能力的强弱,学者们提出了多种数据集,其中包括MCTest,WikiQA,SQuAD,MS MARCO等。这些数据集中的阅读理解题都是由一段长文本和相关的问题组成的。它们的特点是:1、文本较长,机器需要排除文本中与问题不相关的信息的干扰;2、大多数问题的答案直接出现在长文本中的某一句话,机器只需对这句话进行分析即可得到答案;3、句式丰富,语法复杂,机器需要对不同的句式和语法进行分析。但是这些数据集没有强调阅读理解题中事件之间的关系,也就没有要求机器对这些关系进行表达和推理。
Winograd Schema Challenge(WSC)由Hector Levesque等人提出,它可用于评估机器的常识推理能力。WSC数据集由一组单项选择题组成。其中的选择题可被视为阅读理解题。机器在求解WSC数据集中的阅读理解题时,它首先要从题目文本的外部寻找与该题目相关的常识,再将常识与该题目文本进行结合,从而推理出该题目的答案。含常识的WSC数据集是通过为WSC数据集中的阅读理解题添加相关常识的方式来获得的。机器在求解含常识的WSC数据集中的阅读理解题时,它首先需要理解题目中的常识所描述的事件之间的关系,再使用该关系来对题目进行推理求解。因此,含常识的WSC数据集可用于检验机器对阅读理解题进行深层次推理的能力。
目前,以下工作给机器提供了表达阅读理解题文本信息和对阅读理解题进行推理求解的能力。微软亚研院自然计算组提出了R-NET。该方法首先通过一种循环神经网络模型来获取阅读理解题中的文本段落信息,继而使用自我匹配机制来提炼文本段落信息,最后使用指针网络来定位出答案在文本段落中的位置。Chuanqi Tan等人提出了S-NET。该方法通过使用神经网络搭建的答案提取模型和答案综合模型从文章中抽取出正确的答案。Yelong Shen等人提出了ReasoNet。该方法通过进行多轮探索的方式来推理出阅读理解题的问句、文本段落和答案之间的关系。这些方法都是使用神经网络模型来获取用于表达阅读理解题文本的信息,它们在处理句式丰富和语法复杂的数据集时具有一定的优势。但是,这些方法并不适用于求解需要深层次推理的阅读理解题。因此,这些方法并不能很好地求解含常识的WSC数据集中的阅读理解题,所以目前急需一种具有更强的表达能力和推理能力的阅读理解题求解方法。
在基于语义解析和SMT求解的阅读理解题求解方法中,需要使用两个工具。第一个是SEMPRE,它是由斯坦福大学开发的语义解析工具。第二个是Z3,它是一个由微软研究院开发的可满足性模理论(Satisfiability Modulo Theories,简称SMT)求解器。
发明内容
本发明为克服上述现有技术所述的至少一种缺陷(不足),提供了一种基于语义解析和SMT求解的阅读理解题求解方法。
为解决上述技术问题,本发明的技术方案如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810507874.4/2.html,转载请声明来源钻瓜专利网。





