[发明专利]基于多相关帧注意力机制的人脸伪造视频检测方法有效
| 申请号: | 202010851718.7 | 申请日: | 2020-08-21 |
| 公开(公告)号: | CN111986180B | 公开(公告)日: | 2021-07-06 |
| 发明(设计)人: | 张勇东;胡梓珩;谢洪涛 | 申请(专利权)人: | 中国科学技术大学 |
| 主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T7/246;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京凯特来知识产权代理有限公司 11260 | 代理人: | 郑立明;韩珂 |
| 地址: | 230026 安*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 多相 注意力 机制 伪造 视频 检测 方法 | ||
1.一种基于多相关帧注意力机制的人脸伪造视频检测方法,其特征在于,包括:
对于待检测视频,解码为帧序列,并提取出每一帧的脸部图像;
选择一帧作为目标帧,并在目标帧前后各选出N个参考帧,对于2N+1帧中的脸部图像进行特征提取,分别计算目标帧的图像特征与每一参考帧的图像特征之间的帧间注意力信息,对于目标帧前后的帧间注意力信息分别计算平均值,从而得到目标帧的帧前注意力信息和帧后注意力信息,再将目标帧的图像特征与目标帧的帧前注意力信息及帧后注意力信息融合;
基于融合结果进行预测,从而基于整个视频角度的预测结果判断待检测视频是否为人脸伪造视频;
其中,分别计算目标帧的图像特征与每一参考帧的图像特征之间的帧间注意力信息包括:分别计算每一参考帧中提取出的图像特征,与目标帧Ft中提取的图像特征Vt之间的相似性矩阵;每一参考帧利用其自身的图像特征与相应的相似性矩阵,计算出注意力图,进而得到帧间注意力信息。
2.根据权利要求1所述的一种基于多相关帧注意力机制的人脸伪造视频检测方法,其特征在于,在目标帧Ft前后各选出N个参考帧分别记为{Fb1,Fb2,...,FbN}与{Fa1,Fa2,...,FaN};
对2N+1帧中的脸部图像的进行特征提取,记为Vt、{Vb1,Vb2,...,VbN}与{Va1,Va2,...,VaN}。
3.根据权利要求2所述的一种基于多相关帧注意力机制的人脸伪造视频检测方法,其特征在于,
相似性矩阵的计算公式为:
其中,Vmn表示一个参考帧中提取出的图像特征,m=a,b,n=1,2,...,N;W为权重参数矩阵;
计算注意力图:
Zmn=VmnAmn
每一注意力图经过卷积层并使用softmax归一化后,得到帧间注意力信息:
其中,各自为处理注意力图的卷积层的权重、偏置;K表示卷积层中的卷积核数目,i为通道索引。
4.根据权利要求1或2或3所述的一种基于多相关帧注意力机制的人脸伪造视频检测方法,其特征在于,
目标帧的图像特征与前后各选出N个参考帧的图像特征之间的帧间注意力信息记为{Ib1,Ib2,...,IbN}与{Ia1,Ia2,...,IaN};
计算帧间注意力信息的平均值,得到目标帧的帧前注意力信息Ib和帧后注意力信息Ia:
5.根据权利要求1所述的一种基于多相关帧注意力机制的人脸伪造视频检测方法,其特征在于,
将目标帧的图像特征Vt经过一层卷积层得到Gt,再与目标帧的帧前注意力信息Ib及帧后注意力信息Ia对应通道相乘并级联,得到融合结果It:
其中,各自为处理目标帧特征向量的卷积层的权重、偏置;K表示卷积层中的卷积核数目,i为通道索引。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010851718.7/1.html,转载请声明来源钻瓜专利网。





