[发明专利]少样本关系抽取模型的训练方法、装置及终端设备在审
申请号: | 202211159237.5 | 申请日: | 2022-09-22 |
公开(公告)号: | CN115510853A | 公开(公告)日: | 2022-12-23 |
发明(设计)人: | 魏忠诚;郭文杰;张春华;生龙;王超;赵继军 | 申请(专利权)人: | 河北工程大学 |
主分类号: | G06F40/279 | 分类号: | G06F40/279;G06K9/62 |
代理公司: | 河北国维致远知识产权代理有限公司 13137 | 代理人: | 张新利 |
地址: | 056038 河北省*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 样本 关系 抽取 模型 训练 方法 装置 终端设备 | ||
1.一种少样本关系抽取模型的训练方法,其特征在于,包括:
根据获取的句子文本集确定正向训练的第一支持集和第一查询集,所述句子文本集中的实例标注有实体对和关系标签,第一支持集中根据所述关系标签划分有多个类别的第一实例集;
利用所述第一支持集与所述第一查询集对预设的少样本关系抽取模型进行正向训练,得到所述第一查询集中每个第二实例与所述第一支持集中每个类别的第一实例集的正向关系原型,以及根据所述正向关系原型确定所述每个第二实例与所述每个类别的第一实例集之间的第一匹配得分,和所述每个第二实例的伪关系标签;
根据所述第一查询集与所述第二实例的伪关系标签构建逆向训练的第二支持集,根据所述句子文本集和所述第二支持集构建逆向训练的第二查询集,所述第二支持集中根据关系标签划分有多个类别的第二实例集,所述第二实例集的类别与所述第一实例集的类别相对应;
利用所述第二支持集与所述第二查询集对预设的少样本关系抽取模型进行逆向训练,得到所述第二查询集中每个第四实例与所述第二支持集中每个类别的第二实例集的逆向关系原型,以及根据所述逆向关系原型确定所述每个第四实例与所述每个类别的第二实例集之间的第二匹配得分;
根据所述第一匹配得分和所述第二匹配得分确定交叉熵损失值,根据所述正向关系原型和所述逆向关系原型对所述预设的少样本关系抽取模型进行调参,并根据所述交叉熵损失值得到更新后的少样本关系抽取模型。
2.根据权利要求1所述的少样本关系抽取模型的训练方法,其特征在于,所述根据获取的句子文本集确定正向训练的第一支持集和第一查询集,包括:
根据获取的句子文本集和预设任务场景确定正向训练的第一支持集和第一查询集;所述预设任务场景确定了所述第一支持集中第一实例集的类别和所述第一实例集中第一实例的数量;所述第一查询集中第二实例的类别与所述第一实例集的类别相对应。
3.根据权利要求2所述的少样本关系抽取模型的训练方法,其特征在于,所述根据所述第一查询集与所述第二实例的伪关系标签构建逆向训练的第二支持集,根据所述句子文本集和所述第二支持集构建逆向训练的第二查询集,包括:
根据所述预设任务场景、第一查询集与所述第二实例的伪关系标签构建逆向训练的第二支持集;所述第二支持集中包括所述第一查询集中的所有第二实例;所述预设任务场景确定了所述第二支持集中第二实例集的类别和所述第二实例集中第三实例的数量;
根据所述句子文本集和所述第二支持集构建逆向训练的第二查询集;所述第二查询集中第四实例的类别与所述第二实例集的类别相对应。
4.根据权利要求1所述的少样本关系抽取模型的训练方法,其特征在于,所述根据所述第一匹配得分和所述第二匹配得分确定交叉熵损失值,包括:
根据所述第二实例对应的多个所述第一匹配得分,计算正向交叉熵损失值;
根据所述第四实例对应的多个所述第二匹配得分,计算逆向交叉熵损失值;
计算所述正向交叉熵损失值和所述逆向交叉熵损失值之和作为交叉熵损失值。
5.根据权利要求4所述的少样本关系抽取模型的训练方法,其特征在于,所述根据所述第二实例对应的多个所述第一匹配得分,计算正向交叉熵损失值;根据所述第四实例对应的多个所述第二匹配得分,计算逆向交叉熵损失值,包括:
根据所述第二实例对应的多个所述第一匹配得分,计算所述第二实例对应每个类别的概率值;根据所述第二实例对应每个类别的概率值,计算正向交叉熵损失值;
根据所述第四实例对应的多个所述第二匹配得分,计算所述第四实例对应每个类别的概率值;根据所述第四实例对应每个类别的概率值,计算逆向交叉熵损失值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河北工程大学,未经河北工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211159237.5/1.html,转载请声明来源钻瓜专利网。