[发明专利]一种基于领域迁移的关系抽取方法及装置有效
申请号: | 202010051693.2 | 申请日: | 2020-01-17 |
公开(公告)号: | CN111310454B | 公开(公告)日: | 2022-01-07 |
发明(设计)人: | 张熙;刘振龙;谢思泓;李小勇 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/295;G06F16/35;G06N3/04 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 丁芸;马敬 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 领域 迁移 关系 抽取 方法 装置 | ||
1.一种基于领域迁移的关系抽取方法,其特征在于,所述方法包括:
获取待处理文本,所述待处理文本为待进行关系抽取的文本;
提取所述待处理文本中具有第一预设词性的词语,以及具有第二预设词性的词语,并生成所述第一预设词性的词语与所述第二预设词性的词语对应的关系词对;
根据待处理文本的标识,所述关系词对在所述待处理文本中的位置,所述待处理文本所属的领域,生成关系提及特征向量矩阵;所述关系提及特征向量矩阵中的一行表示一个关系提及特征向量;
利用预先训练好的关系分类模型对所述关系提及特征向量矩阵中每一关系提及特征向量进行处理,得到所述关系提及特征向量对应的关系类别,所述关系类别包括:无关系类别和有关系类别;其中,所述关系分类模型,是根据优化后的各第一样本特征向量,以及所述优化后的各第一样本特征向量对应的标准类别标签训练得到的;所述优化后的各第一样本特征向量,是将第一样本特征向量,输入预先训练好的优化模型中得到的;所述优化模型,是根据目标领域中的第二样本特征向量,第二样本特征向量对应的动作,以及源领域中的第三样本特征向量,所述第三样本特征向量对应的类别标签训练得到的,所述目标领域为所述待处理文本所属的领域,所述目标领域与所述源领域为同一领域下的不同子领域;
其中,所述优化模型的训练过程,包括:
构建初始的强化学习模型,以及构建初始的神经网络;
获取第一样本特征向量;
依次针对每一第一样本特征向量,利用所述强化学习模型,得到所述目标领域中的第二样本特征向量;
将各所述第一样本特征向量,各所述第二样本特征向量,各所述第二样本特征向量对应的动作,以及源领域中的第三样本特征向量,所述第三样本特征向量对应的类别标签,输入所述神经网络中,得到各所述第一样本特征向量对应的类别标签;
基于各所述第一样本特征向量对应的类别标签,与所述第三样本特征向量对应的类别标签的差异,计算损失函数,并对所述神经网络中的参数进行更新;
判断所述神经网络的损失函数是否满足第一预设收敛条件,并判断强化学习模型的梯度参数值是否满足第二预设收敛条件;
如果所述神经网络的损失函数满足第一预设收敛条件,且所述强化学习模型的梯度参数值满足第二预设收敛条件,将所述第二样本特征向量,作为优化后的第一样本特征向量;
如果所述神经网络的损失函数不满足第一预设收敛条件,或所述强化学习模型的梯度参数值不满足第二预设收敛条件,将所述神经网络得到的优化后的第一样本特征向量,更新为目标领域中的第一样本特征向量,并返回执行依次针对每一第一样本特征向量,利用所述强化学习模型,得到所述目标领域中的第二样本特征向量的步骤。
2.根据权利要求1所述的方法,其特征在于,所述利用预先训练好的关系分类模型对所述关系提及特征向量矩阵中每一关系提及特征向量进行处理,得到所述关系提及特征向量对应的关系类别的步骤,包括:
将所述关系提及特征向量矩阵中每一关系提及特征向量,输入预先训练好的关系分类模型中,得到所述关系提及特征向量对应的关系类别。
3.根据权利要求1所述的方法,其特征在于,所述获取第一样本特征向量的步骤,包括:
获取样本文本,所述样本文本所属的领域为目标领域;
提取所述样本文本中具有第一预设词性的词语,以及具有第二预设词性的词语,并生成所述第一预设词性的词语与所述第二预设词性的词语对应的关系词对;
根据样本文本的标识,所述关系词对在所述样本文本中的位置,所述样本文本所属的领域,生成所述样本文本对应的关系提及特征向量矩阵;所述样本文本对应的关系提及特征向量矩阵中的一行表示一个关系提及特征向量;
根据预先设置好的知识库,为所述样本文本对应的关系提及特征向量矩阵中每一特征向量添加标签,得到添加标签后的关系提及特征向量矩阵;
将添加标签后的关系提及特征向量矩阵中的关系提及特征向量,确定为第一样本特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010051693.2/1.html,转载请声明来源钻瓜专利网。