[发明专利]对抗文本的生成方法、装置、设备及存储介质有效
申请号: | 202110527819.3 | 申请日: | 2021-05-14 |
公开(公告)号: | CN113204974B | 公开(公告)日: | 2022-06-17 |
发明(设计)人: | 张超;张子晗;刘明烜;段海新;孙东红;李琦 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/247;G06N3/04;G06N3/08 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 杜叶蕊;臧建明 |
地址: | 100084 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对抗 文本 生成 方法 装置 设备 存储 介质 | ||
1.一种对抗文本的生成方法,其特征在于,包括:
获取待处理的文本信息集,其中所述文本信息集中包括有原始文本;所述待处理的文本信息集中还包括有目标语义标签以及原始文本对应的真实语义标签,所述目标语义标签与所述真实语义标签不同;
确定所述原始文本对应的字词序列中各字词在所述原始文本中的优先级;
根据所述各字词的优先级从各字词中选出待处理字词,并对所述待处理字词进行多种扰动处理;
根据对所述待处理字词的多种扰动处理结果以及当前的原始文本生成所述原始文本对应的多个候选文本;
对各候选文本进行语义识别处理,得到各候选文本的语义标签以及各候选文本的置信度;
根据各候选文本的语义标签,选出语义标签与所述目标语义标签一致的任一候选文本作为所述对抗文本,所述对抗文本用于对目标模型进行训练;
其中,在白盒攻击场景下,确定各字词在所述原始文本中的优先级,包括:
通过利用所述目标模型对所述原始文本进行语义识别处理,得到所述原始文本对应的真实语义标签的置信度,并计算所述原始文本对应的真实语义标签的置信度的梯度以及该梯度的幅度,根据得到的幅度确定各字词在所述原始文本中的优先级。
2.根据权利要求1所述的生成方法,其特征在于,若所述各候选文本的语义标签与所述目标语义标签不一致,则所述方法还包括:
根据所述各候选文本以及各候选文本的置信度,对当前的原始文本进行更新,得到更新后的当前的原始文本作为下一次迭代的起始文本;
根据所述各字词的优先级从各字词中选出下一待处理字词,并对所述下一待处理字词进行多种扰动处理;
根据对所述下一待处理字词的多种扰动处理结果以及更新后的当前的原始文本生成多个候选文本;
对各候选文本进行语义识别处理,得到各候选文本的语义标签;若任一候选文本的语义标签与所述目标语义标签一致,则选出语义标签与所述目标语义标签一致的任一候选文本作为所述对抗文本;若各候选文本的语义标签与所述目标语义标签不一致,则执行迭代步骤,直至获得对抗文本或达到迭代停止条件。
3.根据权利要求1所述的生成方法,其特征在于,所述多种扰动处理包括以下处理中的至少一种:基于同义词的字词替换处理、基于语序的交换处理、基于拼音的字词替换处理、基于偏旁的字词拆分处理以及基于部首的替换处理。
4.根据权利要求3所述的生成方法,其特征在于,所述基于部首的替换处理包括:
根据预设的偏旁部首表,对所述待处理字词中的每个待处理字符进行偏旁的拆分,得到所述每个待处理字符对应的至少一个偏旁;
判断所述偏旁是否属于部首,若是,则对所述部首进行多次部首替换处理,以得到多个候选字符;
从多个候选字符中选出与所述待处理字符字形相似度最高的候选字符作为基于部首的替换处理的处理结果。
5.一种对抗文本的生成装置,其特征在于,包括:
获取模块,用于获取待处理的文本信息集,其中所述文本信息集中包括有原始文本;所述待处理的文本信息集中还包括有目标语义标签以及原始文本对应的真实语义标签,所述目标语义标签与所述真实语义标签不同;
处理模块,用于:
确定所述原始文本对应的字词序列中各字词在所述原始文本中的优先级;
根据所述各字词的优先级从各字词中选出待处理字词,并对所述待处理字词进行多种扰动处理;
根据对所述待处理字词的多种扰动处理结果以及当前的原始文本生成所述原始文本对应的多个候选文本;
执行模块,用于对各候选文本进行语义识别处理,得到各候选文本的语义标签以及各候选文本的置信度;根据各候选文本的语义标签,选出语义标签与所述目标语义标签一致的任一候选文本作为所述对抗文本,所述对抗文本用于对目标模型进行训练;
所述处理模块在白盒攻击场景下,确定各字词在所述原始文本中的优先级时,还具体用于:
通过利用所述目标模型对所述原始文本进行语义识别处理,得到所述原始文本对应的真实语义标签的置信度,并计算所述原始文本对应的真实语义标签的置信度的梯度以及该梯度的幅度,根据得到的幅度确定各字词在所述原始文本中的优先级。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110527819.3/1.html,转载请声明来源钻瓜专利网。