[发明专利]一种基于增强学习的关系抽取方法有效
申请号: | 201910278459.0 | 申请日: | 2019-04-08 |
公开(公告)号: | CN110059314B | 公开(公告)日: | 2023-04-25 |
发明(设计)人: | 刘兵;漆桂林;柏超宇 | 申请(专利权)人: | 东南大学 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F16/36;G06F16/35;G06N3/04;G06N3/08 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
地址: | 211100 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 增强 学习 关系 抽取 方法 | ||
本发明公开了一种基于增强学习的关系抽取方法,包括:步骤10)构建强化学习的关系抽取框架;所述关系抽取框架包括基于DNN模型的关系抽取模型、用于表示关系的人类知识形式的软规则和含有查询问题的关系证据、外部的知识源和智能体;步骤20)获取所述基于DNN模型的关系抽取模型的抽取结果;步骤30)所述智能体在强化学习环境中,利用所述软规则和所述关系证据,对所述抽取结果进行动态调整。所述基于增强学习的关系抽取方法可以增强现有的基于DNN的关系抽取模型。
技术领域
本发明属于计算机自然语言处理领域,具体来说,涉及一种基于增强学习的关系抽取方法。
背景技术
关系抽取(RE)目的在于抽取文本中实体对的语义关系。例如,在图1中给定句子#1,关系抽取的目标是确定Phil Schiller和sale department存在关系director_of_organizatione1,e2。关系抽取被广泛用于后续应用,例如本体构建,知识库(KB)构建以及问答系统。解决关系抽取问题,前人已经做了许多的工作,其中使用基于深度神经网络(DNN)的模型逐渐成为主流。这些基于DNN的模型为从大量数据中学习特征提供了巨大的机能,以及显著提高了关系抽取的效果。尽管取得了令人瞩目的进步,但广泛使用基于DNN的关系抽取模型仍有局限性。
一个局限是基于DNN的关系抽取系统难以人工校正。基于DNN的关系抽取模型具有从数据中自动提取特征的强大功能。但它们是黑盒模型,并且难将人类意图编码至模型,来引导它们捕获所需的模式,除非借助耗费资源的直接监督或临时初始化。因此,在调优关系抽取结果时,人们很难采取手段去纠正基于DNN的关系抽取模型。另一方面,虽然基于规则的关系抽取系统依赖于人工规则,这些规则构建起来非常耗时且无法扩展,但它们应对错误时易于定制并且可由人类解释。
另一个局限是基于DNN的RE模型缺乏足够的信息来进行预测。一方面,基于DNN的关系抽取模型依赖于词向量,其包含的信息可能不足够进行关系抽取。另一方面,单句中信息的稀疏可能导致判断的模糊。如图1所示关系″the director of″,在句子#1中表示关系director_of_organizatione1,e2,而在句子#2中表示关系director_of_filme1,e2。在这种情况下,如果没有足够的背景信息(例如实体的类型),关系抽取模型就无法进行正确的预测。这样的背景信息可能来自多个异构的信息源,例如知识库,搜索引擎和大量的在线数据。但是,之前的工作只是尝试引入其他语言信息,例如WordNet中的上位词以及使用自然语言处理工具(NLP)得到的依赖树结构。他们都忽略了其他信息。
发明内容
本发明提出一种基于增强学习的关系抽取方法,以增强现有的基于DNN的关系抽取模型。
为解决上述技术问题,本发明实施例采用以下技术方案:
一种基于增强学习的关系抽取方法,包括:
步骤10)构建强化学习的关系抽取框架;所述关系抽取框架包括基于DNN模型的关系抽取模型、用于表示关系的人类知识形式的软规则和含有查询问题的关系证据、外部的知识源和智能体;
步骤20)获取所述基于DNN模型的关系抽取模型的抽取结果;
步骤30)所述智能体在强化学习环境中,利用所述软规则和所述关系证据,对所述抽取结果进行动态调整。
作为优选例,所述步骤20)中,获取所述基于DNN模型的关系抽取概率分布,并进行降序排列,生成关系抽取结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910278459.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:翻译处理方法和装置
- 下一篇:一种科技资源感知融合决策方法