[发明专利]基于生成对抗模型的全自动抠图方法及装置、介质和设备有效

申请号：	202110346470.3	申请日：	2021-03-31
公开（公告）号：	CN113034517B	公开（公告）日：	2023-02-14
发明（设计）人：	周泽洋;韩国强	申请（专利权）人：	华南理工大学
主分类号：	G06T7/11	分类号：	G06T7/11
代理公司：	广州市华学知识产权代理有限公司 44245	代理人：	郑浦娟
地址：	510640 广***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于生成对抗模型全自动方法装置介质设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于生成对抗模型的全自动抠图方法，其特征在于，包括：

第一阶段：

1-1)随机产生一段高斯噪声作为隐空间编码；

1-2)将隐空间编码输入到生成对抗模型的生成器中，生成器输出该隐空间编码对应的一张图片；

1-3)计算生成器输出图片和待抠图的输入图片的均方误差损失和感知损失，并根据均方误差损失和感知损失对隐空间编码进行更新，经过多次迭代更新后，得到优化的隐空间编码，并将优化的隐空间编码作为初始的待抠图输入图片所对应的隐空间编码；

第二阶段：

2-1)将初始的输入图片所对应的隐空间编码输入到生成对抗模型的生成器中，生成器输出一张图片，该图片为输入图片的替代图片；

2-2)将该替代图片输入至分割网络中，分割网络产生三元分割图和三元分割图的置信度，并根据三元分割图的置信度计算熵最小化损失；

2-3)将三元分割图和替代图片均输入到抠图模块中，得到图片的主体区域；

2-4)主体区域再结合输入图片和任意一张背景图片，得到一张新图片，将该新图片输入至生成对抗模型的判别器中，计算对抗损失，根据熵最小化损失和对抗损失对隐空间编码进行更新，经过多次迭代更新后，得到最终待抠图的输入图片所对应的隐空间编码；

2-5)重复步骤2-1)～2-4)，得到图片的主体区域，该主体区域即是最终的抠图结果。

2.根据权利要求1所述的全自动抠图方法，其特征在于，生成对抗模型采用StyleGan2模型，分割网络采用Deeplab模型，抠图模块采用DeepImageMatting模型。

3.根据权利要求1所述的全自动抠图方法，其特征在于，在步骤1-1)中，生成一段服从高斯分布的随机变量作为生成对抗模型的隐空间编码，这段随机变量为一个512维的向量，均值为0，方差为1。

4.根据权利要求1所述的全自动抠图方法，其特征在于，在步骤1-3)中，均方误差损失Loss_mse的计算公式如下：

感知损失Loss_percept的计算公式如下：

其中，i表示像素位置，n表示图像的像素总个数，I_in,i表示输入图像在第i个像素位置的值，I_0,i表示步骤1-2)生成器输出的图像中第i个像素位置的值，Φ(·)代表在ImageNet上训练好的VGG-16网络的计算；

之后计算隐空间编码处对应均方误差损失和感知损失的梯度，根据得到的均方误差损失和感知损失，沿梯度减小的方向更新隐空间编码，直至达到预设的迭代次数，使得1-2)中生成器输出的图片与输入图片在视觉上一致。

5.根据权利要求1所述的全自动抠图方法，其特征在于，在步骤2-2)中，熵最小化损失Loss_entropy的计算公式为：

其中，i表示像素位置，n表示图像的像素总个数，P_i表示第i个像素分割结果的置信度。

6.根据权利要求1所述的全自动抠图方法，其特征在于，在步骤2-4)中，对抗损失Loss_D的计算公式为：

Loss_D＝-log(1-D(I_in))

其中，D(·)代表判别器的计算，I_in代表输入到判别器的图像；

之后计算隐空间编码对应熵最小化损失和对抗损失的梯度，根据熵最小化损失和对抗损失，沿梯度减小的方向更新隐空间编码，直至达到预设的迭代次数，得到最终的输入图片所对应的隐空间编码。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于华南理工大学，未经华南理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110346470.3/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载