[发明专利]用于DeepFake鉴伪模型的伪造数据互生成方法在审
申请号: | 202211279346.0 | 申请日: | 2022-10-19 |
公开(公告)号: | CN115620367A | 公开(公告)日: | 2023-01-17 |
发明(设计)人: | 孙哲南;茹一伟;何召峰 | 申请(专利权)人: | 天津中科智能识别有限公司 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V10/82 |
代理公司: | 天津市三利专利商标代理有限公司 12107 | 代理人: | 韩新城 |
地址: | 300450 天津市滨海新区天津经济技*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 deepfake 模型 伪造 数据 互生 成方 | ||
本发明公开一种用于DeepFake鉴伪模型的伪造数据互生成方法,包括:对输入图像进行人脸检测,提取输入的人脸图像;根据输入的人脸图像生成人脸轮廓;在人脸数据库中搜索与前述的人脸轮廓的匹配度符合阈值的人脸轮廓;提取输入的人脸图像的人脸轮廓的内区域以及人脸数据库中匹配到的人脸轮廓的外区域;将输入的人脸图像的人脸轮廓的内区域进行平滑和压缩操作后,与人脸数据库匹配到的人脸轮廓的外区域融合,生成带伪影信息的伪造人脸数据。本发明可以实现伪造人脸数据的快速生成,满足了训练的需要。
技术领域
本发明涉及DEEPFAKE伪造鉴别模型训练技术领域,特别是涉及一种用于DeepFake鉴伪模型的伪造数据互生成方法。
背景技术
DEEPFAKE伪造鉴别模型训练的过程中,数据至关重要,数据量与数据种类的增多可以大幅提升模型的性能。数据又可以分为伪造数据与真实数据,在实际训练的过程中,真实数据通过对视频、媒体网站爬虫可以较容易的获得,伪造数据的生成则具有一定的难度。
通过现有生成算法生成伪造数据的难度主要如下:
a)生成算法性能稳定性差:目前基于GAN网络的生成算法在大批量的生成过程中,生成的人脸大部分不具备可用性,需要通过手工挑选的方式选出质量较高的人脸。实际过程中,质量较高可用的人脸占总生成人脸的比例不超过20%。
b)生成算法生成效率低:实际训练过程中,数据的需求量很大,量级在数十万到数百万,甚至千万以上,通过基于GAN网络的生成算法来生成人脸数据,生成效率过低,若生成上万个人脸,不考虑后期人脸挑选,单台8卡GPU服务器依然需要数周的时间。
c)生成算法对计算资源要求高:基于GAN网络的生成算法在训练、前传过程对服务器的内存、GPU的性能要求很高,且搭建可用于生成算法的服务器资金投入较多。故而一般的小企业、小实验室、个人用户很难具备大批量数据的生成能力。
发明内容
本发明的目的是针对现有技术中存在的技术缺陷,而提供一种用于DeepFake鉴伪模型的伪造数据互生成方法,可实现人脸伪造数据的快速生成。
为实现本发明的目的所采用的技术方案是:
一种用于DeepFake鉴伪模型的伪造数据互生成方法,包括
对输入图像进行人脸检测,提取输入的人脸图像;
根据所述输入的人脸图像生成人脸轮廓;
在人脸数据库中搜索与所述人脸轮廓的匹配度符合阈值的人脸轮廓;
提取所述输入的人脸图像的人脸轮廓的内区域以及人脸数据库中匹配到的人脸轮廓的外区域;
将所述输入的人脸图像的人脸轮廓的内区域填充到人脸数据库匹配到的人脸轮廓的外区域中进行融合;
对融合后图像的人脸轮廓周边像素进行平滑操作,生成带有伪影信息的伪造人脸数据。
优选的,采用高斯平滑算法对融合后图像的人脸轮廓周边像素进行平滑操作。
优选的,通过Hu矩轮廓匹配算法在人脸数据库中搜索与所述人脸轮廓的匹配度符合阈值的人脸轮廓。
优选的,根据所述输入的人脸部图像生成人脸轮廓的步骤是,从所述人脸图像中提取关键点,然后基于所述关键点形成人脸轮廓。
优选的,采用人脸关键点检测算法,从所述输入的人脸图像中提取人脸关键点,然后按次序将边缘的关键点顺序连线从而形成人脸轮廓。
优选的,利用轮廓提取方法提取所述输入的人脸图像的人脸轮廓的内区域以及人脸数据库中匹配到的人脸轮廓的外区域;
其中,所述轮廓提取方法的提取步骤是:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津中科智能识别有限公司,未经天津中科智能识别有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211279346.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种气体纯化器废气处理装置
- 下一篇:一种电池检测方法