[发明专利]一种面向文本审核的中文对抗样本生成方法及装置在审
申请号: | 202011259475.4 | 申请日: | 2020-11-12 |
公开(公告)号: | CN112364641A | 公开(公告)日: | 2021-02-12 |
发明(设计)人: | 王婧宜;孔庆超;张佳旭;蒋永余;郭建彬;吴晓飞;曹家;赵菲菲;罗引;王磊 | 申请(专利权)人: | 北京中科闻歌科技股份有限公司;深圳中科闻歌科技有限公司;北京中科闻歌智安科技有限公司 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/166 |
代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 卢万腾;吴雪 |
地址: | 100028 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请涉及一种面向文本审核的中文对抗样本生成方法及装置,其中方法包括:获取待处理语句信息;对待处理语句信息进行分词,得到多个词语;确定词语的第一重要性信息;获取各个词语对应的扰动词语;根据第一重要性信息,依次得到将待处理语句信息中各个词语替换为对应的扰动词语后的扰动语句信息;在确定扰动语句信息满足预设条件时,根据扰动语句信息得到对待处理语句信息攻击成功后的对抗样本。通过本实施例中的方法可以实现对待处理语句进行词语替换的方式得到对抗样本,进而可以增加用于对预测模型进行训练的样本的多样性,同时可以通过自动生成对抗样本,提升训练数据获取的便利性,提升模型训练的效率。 | ||
搜索关键词: | 一种 面向 文本 审核 中文 对抗 样本 生成 方法 装置 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中科闻歌科技股份有限公司;深圳中科闻歌科技有限公司;北京中科闻歌智安科技有限公司,未经北京中科闻歌科技股份有限公司;深圳中科闻歌科技有限公司;北京中科闻歌智安科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202011259475.4/,转载请声明来源钻瓜专利网。
- 上一篇:一种五金加工用打磨装置
- 下一篇:一种高性能绝缘胶的制备方法