[发明专利]基于知识蒸馏和多任务学习的篇章关系识别方法与装置有效
申请号: | 202110078740.7 | 申请日: | 2021-01-21 |
公开(公告)号: | CN112395876B | 公开(公告)日: | 2021-04-13 |
发明(设计)人: | 邬昌兴;谢子若 | 申请(专利权)人: | 华东交通大学 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/30;G06N20/20;G06N3/04 |
代理公司: | 北京中济纬天专利代理有限公司 11429 | 代理人: | 黄攀 |
地址: | 330000 江西省南*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 知识 蒸馏 任务 学习 篇章 关系 识别 方法 装置 | ||
1.一种基于知识蒸馏和多任务学习的篇章关系识别方法,其特征在于,所述方法包括如下步骤:
以标注了连接词与隐式篇章关系类别的隐式篇章关系实例作为训练实例;
基于双向注意力机制分类模型构造连接词加强的教师模型,以所述连接词作为额外输入,对所述连接词加强的教师模型对应的代价函数进行迭代最小化处理直至收敛,以得到训练好的教师模型;
基于所述双向注意力机制分类模型构造多任务学习学生模型,引入连接词分类作为辅助任务,以确定基于多任务学习的代价函数,利用所述训练好的教师模型计算训练实例的特征和预测结果,以确定基于知识蒸馏的代价函数,继而确定学生模型总代价函数;
迭代最小化所述学生模型总代价函数直至收敛,以输出训练好的学生模型,进而用于识别测试实例的隐式篇章关系。
2.根据权利要求1所述的基于知识蒸馏和多任务学习的篇章关系识别方法,其特征在于,在所述训练实例中,标注了所述连接词与所述隐式篇章关系类别的隐式篇章关系实例表示为;
其中,表示所述隐式篇章关系训练实例,其中,表示所述隐式篇章关系训练实例中的论元1,表示所述隐式篇章关系训练实例中的论元2,表示标注的连接词,表示标注的隐式篇章关系类别。
3.根据权利要求2所述的基于知识蒸馏和多任务学习的篇章关系识别方法,其特征在于,在所述连接词加强的教师模型中,输入为对应的代价函数表示为:
其中,为教师模型的参数,为标注的隐式篇章关系类别对应的独热编码,表示预测结果关于标记类别的期望值,表示经所述连接词加强的教师模型的分类层后得到的预测结果,为训练实例集。
4.根据权利要求2所述的基于知识蒸馏和多任务学习的篇章关系识别方法,其特征在于,在所述多任务学习学生模型中,所述学生模型总代价函数表示为:
其中,为所述学生模型总代价函数,为学生模型的参数,分别为基于多任务学习的代价函数和基于知识蒸馏的代价函数的权重系数;
所述基于多任务学习的代价函数包括两部分: 为对应于隐式篇章关系识别的交叉熵代价函数,为对应于连接词分类的交叉熵代价函数;所述基于知识蒸馏的代价函数包括两部分: 为对应于特征抽取层知识蒸馏的代价函数,为对应于分类层知识蒸馏的代价函数。
5.根据权利要求4所述的基于知识蒸馏和多任务学习的篇章关系识别方法,其特征在于,在所述多任务学习学生模型中,输入为,对应于隐式篇章关系识别的交叉熵代价函数表示为:
其中,为标注的隐式篇章关系类别对应的独热编码,表示预测结果关于标记类别的期望值,表示经所述多任务学习学生模型分类层1后得到的对应于隐式篇章关系识别的预测结果,为训练实例集。
6.根据权利要求4所述的基于知识蒸馏和多任务学习的篇章关系识别方法,其特征在于,所述多任务学习学生模型中对应于连接词分类的交叉熵代价函数表示为:
其中,为标注的连接词的独热编码,表示预测结果关于标注连接词的期望值,表示经学生模型分类层2后得到的对应于连接词分类的预测结果,为训练实例集。
7.根据权利要求4所述的基于知识蒸馏和多任务学习的篇章关系识别方法,其特征在于,所述多任务学习学生模型中对应于特征抽取层知识蒸馏的代价函数表示为:
其中,表示均方误差,表示经所述连接词加强的教师模型特征抽取层后得到的特征,表示经所述多任务学习学生模型的特征抽取层后得到的特征,为训练实例集。
8.根据权利要求4所述的基于知识蒸馏和多任务学习的篇章关系识别方法,其特征在于,所述多任务学习学生模型中对应于分类层知识蒸馏的代价函数表示为:
其中,表示两个概率分布之间的KL距离,表示经所述连接词加强的教师模型分类层后得到的预测结果,表示经所述多任务学习学生模型分类层1后得到的预测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东交通大学,未经华东交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110078740.7/1.html,转载请声明来源钻瓜专利网。