[发明专利]一种文本对抗训练方法在审

申请号：	202210954309.9	申请日：	2022-08-10
公开（公告）号：	CN115345164A	公开（公告）日：	2022-11-15
发明（设计）人：	陆性天;黄欣;曹波;杨博;曹晓翀;张婧;王贇玥	申请（专利权）人：	上证所信息网络有限公司
主分类号：	G06F40/295	分类号：	G06F40/295;G06F40/103;G06F40/151;G06N3/04;G06N3/08
代理公司：	上海三方专利事务所(普通合伙) 31127	代理人：	吴玮
地址：	201203 上海***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种文本对抗训练方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开一种文本对抗训练方法，具体的方法包括：数据预处理、构建基础命名实体识别模型、在进行模型训练时加入对抗训练和训练模型直至模型收敛，其中在加入对抗训练时包括：在进行反向传播之后，不立刻进行参数更新，开始对embedd i ng层进行对抗训练、备份embedd i ng层参数data和梯度grad、使用正态分布随机初始化扰动de l ta，形状同embedd i ng一样、修改扰动de l ta＝de l ta+grad*a l pha，a l pha为超参数、对de l ta进行l 2标准化、重复修改扰动和标准化步骤K次、在原有参数上加入扰动，data`＝data+de l ta、重新进行反向传播，计算梯度grad`、还原参数data；本发明与现有技术相比，操作简单，训练速度和收敛速度快，由原有K+1时间变成了1+1，且整体效果好，效果不低于smart效果。

技术领域

本发明涉及信息技术领域，具体来说是一种文本对抗训练方法。

背景技术

对抗训练是一种引入噪声的训练方式，可以对参数进行正则化，提升模型鲁棒性和泛化能力。

对抗训练的假设是：给输入加上扰动之后，输出分布式和原Y的分布一致；在对抗训练中关键的是需要找到对抗样本，通常是对原始的输入添加一定的扰动来构造，然后放给模型训练，这样模型就有了识别对抗样本的能力，其中的关键技术在于如果构造扰动，使得模型在不同的攻击样本中均能够具备较强的识别性。

对抗训练，简单来说，就是在原始输入样本上加上一个扰动得到对抗样本后，用其进行训练。

2018年Madry针对对抗学习定义了一个Min-Max的公式，即

该公式有两部分：

第一部分为内部损失函数的最大化，对抗的思想即是往增大损失的方向增加扰动，S SS定义为扰动空间，此时我们的目的就是求得让判断失误最多的扰动量，即最佳的攻击参数。

第二部分为外部风险的最小化，我们希望的是给输入加上扰动后，输出分布还能够和原分布相同，此时我们的目的就是在针对上述攻击的情况下找到最鲁邦的模型参数。

现有的技术方案包括：FGM、PGD、FreeAT、YOPO、FreeLB、SMART等，下面对其进行简单的介绍：

FGM：最原始、朴素的对抗训练方式，原理简单，效果直观，处理逻辑如下：