[发明专利]Deepfake合成视频检测方法、系统及设备在审
申请号: | 202210979393.X | 申请日: | 2022-08-16 |
公开(公告)号: | CN115393760A | 公开(公告)日: | 2022-11-25 |
发明(设计)人: | 刘光尧;李志刚;胡永健;郭晶晶;黄威;汪磊;佘惠敏;余泽琼 | 申请(专利权)人: | 公安部物证鉴定中心 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V40/16;G06V10/80;G06V10/774;G06V10/764;G06V10/52;G06V10/25;G06T7/00 |
代理公司: | 北京纪凯知识产权代理有限公司 11245 | 代理人: | 刘美丽 |
地址: | 100038 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | deepfake 合成 视频 检测 方法 系统 设备 | ||
本发明涉及一种Deepfake合成视频检测方法、系统、设备及介质,包括:划分数据集进行分帧,并提取各帧检测区域的RGB图像I;利用双树复小波变换将RGB图像I分解为低频子带SL和不同方向的高频子带集合SH;将低频子带SL和高频子带集合SH分别输入到频域特征提取网络,得到频域特征FDT‑CWT;将低频子带SL和高频子带集合SH输入到基于能量调整的图像增强分支进行处理,得到空域特征FRGB;将频域特征FDT‑CWT和空域特征FRGB进行特征拼接融合,获得单帧分类特征FC;将单帧分类特征FC输入到预选训练的分类器网络模块实现Deepfake视频鉴别,输出判决类别。
技术领域
本发明是关于一种基于双树复小波变换(DT-CWT)的Deepfake合成视频检测方法、系统、设备及介质,涉及Deepfake合成视频篡改检测技术领域。
背景技术
近年来,得益于深度生成模型的快速发展,以Deepfake为代表的视频深度伪造合成技术在互联网上快速流行。随着深度学习方面众多开源技术的出现,视频合成的技术门槛也越来越低,一些不法分子能够未经许可轻易合成特定人物的假视频并恶意使用,因此针对Deepfake合成视频的检测至关重要。
现有Deepfake合成视频检测算法主要通过神经网络实现,此类检测方法在库内的检测准确率通常可高达99%以上,然而在跨库测试时性能出现明显下降,存在泛化性能不足的问题。
为了提高算法的泛化性能,现有检测技术公开有利用DCT提取频域信息并分析局部频率统计特性用于Deepfake合成视频伪造检测,在压缩视频上实现了较好的检测结果,但是在跨库检测时仍然出现较大下降。现有检测技术还公开了基于RGB图像和高频噪声的双流网络进行Deepfake合成视频的检测,通过两个模态之间的信息交互促进特征学习,但是噪声特征容易受到人脸数据来源和人脸伪造方法的影响,导致不同数据库的噪声特性有所差别,因此算法的泛化能力仍有待提高。
发明内容
针对上述问题,本发明的目的是提供一种能够有助于提高检测性能,增强算法鲁棒性的Deepfake合成视频检测方法、系统、设备及介质。
为实现上述目的,本发明采取以下技术方案:
第一方面,本发明提供一种Deepfake合成视频检测方法,包括:
划分数据集,对各个数据集的视频进行分帧,并提取各帧检测区域的RGB图像I;
利用双树复小波变换将RGB图像I分解为低频子带SL和不同方向的高频子带集合SH;
将低频子带SL和高频子带集合SH分别输入到频域特征提取网络,得到频域特征FDT-CWT;
将低频子带SL和高频子带集合SH输入到基于能量调整的图像增强分支进行处理,得到空域特征FRGB;
将频域特征FDT-CWT和空域特征FRGB进行特征拼接融合,获得单帧分类特征FC;
将单帧分类特征FC输入到预选训练的分类器网络模块实现Deepfake视频鉴别,输出判决类别。
所述的Deepfake合成视频检测方法,进一步地,利用双树复小波变换将RGB图像I分解为低频子带SL和不同方向的高频子带集合SH,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于公安部物证鉴定中心,未经公安部物证鉴定中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210979393.X/2.html,转载请声明来源钻瓜专利网。