[发明专利]基于生成对抗网络的去除手势图像背景的方法在审
申请号: | 202010984112.0 | 申请日: | 2020-09-10 |
公开(公告)号: | CN112215868A | 公开(公告)日: | 2021-01-12 |
发明(设计)人: | 王庆飞;王长波;姜燕 | 申请(专利权)人: | 湖北医药学院 |
主分类号: | G06T7/194 | 分类号: | G06T7/194;G06N3/08;G06N3/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 442000 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 生成 对抗 网络 去除 手势 图像 背景 方法 | ||
基于生成对抗网络的去除手势图像背景的方法,包括如下几个步骤:步骤一:模型建立:包括建立生成对抗网络模型、定义关于模型目标函数、引入批量归一化层、引入线性整流函数激活函数和引入Dropout层;步骤二:模型训练,步骤三:模型使用,包括预处理、归一化和调用模型,最终得到的输出即为不带背景的手势图像。本发明具有高效、准确、快速、易部署等特点。
技术领域
本发明涉及图像处理技术领域,特别涉及基于生成对抗网络的去除手势图像背景的方法。
背景技术
对含有手势的图像进行背景移除任务时,当前主流方法是图像语义分割。然而目前该方法存在的一个问题是效率低,难以处理精细化的图像背景移除任务。
2014年FCN(Fully Convolutional Networks for Semantic Segmentation)开启了图像分割的新篇章,在原来简单的VGG,AlexNet神经网络方法上采用了上采样,采用跳跃连接,可以实现对图像语义的分割。后续研究者主要的工作是对网络的更改,对一些特定任务引入注意力机制。但是这些工作也存在一些问题:例如,丢失边缘信息、粒度不够精细等,如图1所示。为实现更为精细化的抠图任务,同时不丢失重要的边缘信息,则需要依赖更为复杂的卷积神经网络和更大的训练开销。
发明内容
为了克服上述现有方法的不足,本发明的目的在于提供基于生成对抗网络的去除手势图像背景的方法,具有高效、准确、快速、易部署等特点。为实现上述目的,本发明采取以下技术方案:基于生成对抗网络的去除手势图像背景的方法,其主要包括如下几个步骤:
步骤一:模型建立
步骤1.1建立生成对抗网络模型,条件GAN网络包括两个模块,分别为生成器G和判别器D,其中生成器G训练的目标是让生成图像以假乱真,判别器D训练目标是检测生成器G生成的假图像;
步骤1.2定义关于模型目标函数,损失函数是决定模型训练优化的目标的数学方法,在生成对抗网络中,随机噪声向量z到输出图片y的映射关系,即G:z→y,条件生成对抗网络将输入图像x和随机噪声向量z到输出图像y的映射关系,即CG:(x,z)→y;
生成对抗网络的目标函数如式:
该式中,x是带背景图片,y是生成器G生成的图片,z是引入的随机噪声图片向量;
需要通过训练,让生成器G使得这个目标函数尽可能小,而判别器D想尽可能使得这个目标函数大,即训练优化的方式为式:
其中,LcGAN(G,D)是生成对抗网络的目标函数,上述已经说明,其中是对判别器做最大值优化,是对生成器做最小值优化,当取到最小值时取得模型的参数;
然而生成器G的任务不仅是欺骗鉴别器,而且还要使它接近真正意义上的无背景真实输出,所以修正后的目标函数为式
其中Lz1(G)=Ex,y,z[||y-G(x,z)||1],目标是为了让生成器的输出接近真正意义上的无背景的真实输出,而λ是一介于0-1之间的系数,用于平衡图像的质量;
步骤1.3引入批量归一化层:
模型中需要使用到批量归一化(Batch normalization,BN)层,其中,BN层的操作主要是对卷积层的输出进行标准化,计算形式如式(5)所示:
其中μB处理如式(6)所示,σB的计算处理如式(7)所示,是为了防止分母为0而引入的无穷小值,xi是当前层的输入。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖北医药学院,未经湖北医药学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010984112.0/2.html,转载请声明来源钻瓜专利网。