[发明专利]基于离散余弦变换的视频目标分割对抗攻击方法有效
申请号: | 202210481562.7 | 申请日: | 2022-05-05 |
公开(公告)号: | CN114821432B | 公开(公告)日: | 2022-12-02 |
发明(设计)人: | 潘震;李平;张宇 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V10/26;G06V10/82;G06N3/04;G06N3/08;G06T7/246;G06T7/269 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 陈炜 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 离散 余弦 变换 视频 目标 分割 对抗 攻击 方法 | ||
1.基于离散余弦变换的视频目标分割对抗攻击方法,其特征在于:首先获取视频数据集合、像素级目标类别矩阵与预训练的视频目标分割模型,然后进行如下操作:
步骤(1)对视频进行均匀采样,获取T个视频帧,得到视频帧序列和真实掩膜序列Xt表示第t个视频帧,Yt为第t个视频帧对应的真实掩膜,T为视频帧数目,表示实数域,H、W分别表示视频帧的高度、宽度,3表示RGB通道数;
将视频帧序列中的每个视频帧Xt依次输入到由残差卷积神经网络组成的预训练视频目标分割模型中,在模型的中间层获得对应的原始视频帧语义特征中间层即模型总层数的一半向上取整的第l层卷积;其中H′、W′、C′分别为视频帧语义特征的高度、宽度和通道数,Φl(·)为预训练视频目标分割模型第l层卷积前的所有网络结构;
步骤(2)构建视频目标运动感知模块,将视频帧序列作为输入,获得运动向量O′t;
步骤(3)构建语义权重量化模块,引入初始化的语义权重梯度张量与运动向量一并作为输入,获得语义权重Qt;
所述的语义权重量化模块由语义权重量化函数组成,初始化全1的语义权重梯度矩阵语义权重矩阵并与运动向量O′t输入语义权重量化函数获得语义权重其中,α为扰动系数其大小设置为2.0/255,Φ(Xt)为预训练视频目标分割模型对第t个帧视频的预测掩膜,为更新后的语义权重梯度矩阵表示交叉熵损失函数,⊙为逐元素乘积,Softmax(·)指Softmax函数其作用为对变量进行归一化;
步骤(4)构建语义离散余弦筛选模块,将语义权重Qt与视频帧语义特征Zt作为输入,获得对抗性语义特征
(4-1)构建语义离散余弦筛选模块由离散余弦变换函数、反离散余弦变换函数和阈值函数组成,将获得的第1~T个原始视频帧语义特征Zt依次输入离散余弦变换函数,获得频域语义特征Cosine(·)表示离散余弦变换函数;
(4-2)将语义权重Qt中每个元素qk依次输入阈值函数获得语义筛选矩阵k表示语义权重Qt中的第k个元素,β为一个大于0的阈值系数;
(4-3)将语义筛选矩阵与频域语义特征Z′t进行逐元素乘积获得筛选频域语义特征
(4-4)将筛选频域语义特征输入反离散余弦变换函数,获得对抗性语义特征InverseCosine(·)表示反离散余弦变换函数;
步骤(5)固定由视频目标运动感知模块、语义权重量化模块、语义离散余弦筛选模块构成的语义攻击网络参数,使用交叉熵损失函数迭代优化对抗性语义特征,获得优化的对抗性语义特征集合
步骤(6)将优化的对抗性语义特征集合输入视频目标分割模型中间层的后一层,并经过后续网络层,获得被攻击后的视频目标分割结果。
2.如权利要求1的基于离散余弦变换的视频目标分割对抗攻击方法,其特征在于,步骤(1)中对视频进行每秒5~10帧的均匀采样。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210481562.7/1.html,转载请声明来源钻瓜专利网。