[发明专利]基于生成对抗网络的去除手势图像背景的方法在审
申请号: | 202010984112.0 | 申请日: | 2020-09-10 |
公开(公告)号: | CN112215868A | 公开(公告)日: | 2021-01-12 |
发明(设计)人: | 王庆飞;王长波;姜燕 | 申请(专利权)人: | 湖北医药学院 |
主分类号: | G06T7/194 | 分类号: | G06T7/194;G06N3/08;G06N3/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 442000 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 生成 对抗 网络 去除 手势 图像 背景 方法 | ||
1.基于生成对抗网络的去除手势图像背景的方法,其特征在于,包括如下几个步骤:
步骤一:模型建立:
步骤1.1建立生成对抗网络模型;
步骤1.2定义关于模型目标函数;
步骤1.3引入批量归一化层;
步骤1.4引入线性整流函数激活函数和步骤1.5引入Dropout层;
步骤二:模型训练
步骤三.模型使用(去除手势背景)
3.1.1预处理;
3.1.2归一化;
3.2调用模型,最终得到的输出即为不带背景的手势图像。
2.根据权利要求1所述的基于生成对抗网络的去除手势图像背景的方法,其特征在于,
所述的步骤一包括:
步骤1.1建立生成对抗网络模型,条件GAN网络包括两个模块,分别为生成器G和判别器D,其中生成器G训练的目标是让生成图像以假乱真,判别器D训练目标是检测生成器G生成的假图像;
步骤1.2定义关于模型目标函数,损失函数是决定模型训练优化的目标的数学方法,在生成对抗网络中,随机噪声向量z到输出图片y的映射关系,即G:z→y,条件生成对抗网络将输入图像x和随机噪声向量z到输出图像y的映射关系,即CG:(x,z)→y;
生成对抗网络的目标函数如式:
该式中,x是带背景图片,y是生成器G生成的图片,z是引入的随机噪声图片向量;
需要通过训练,让生成器G使得这个目标函数尽可能小,而判别器D想尽可能使得这个目标函数大,即训练优化的方式为式:
其中,LcGAN(G,D)是生成对抗网络的目标函数,上述已经说明,其中是对判别器做最大值优化,是对生成器做最小值优化,当取到最小值时取得模型的参数;
然而生成器G的任务不仅是欺骗鉴别器,而且还要使它接近真正意义上的无背景真实输出,所以修正后的目标函数为式
其中目标是为了让生成器的输出接近真正意义上的无背景的真实输出,而λ是一介于0-1之间的系数,用于平衡图像的质量;
步骤1.3引入批量归一化层:
模型中需要使用到批量归一化层,其中,BN层的操作主要是对卷积层的输出进行标准化,计算形式如式(5)所示:其中μB处理如式(6)所示,σB的计算处理如式(7)所示,是为了防止分母为0而引入的无穷小值,xi是当前层的输入;
关于公式的定义:μB是当前卷积核上平均值,σB是当前卷积核内所有像素值的方差xi是当前的像素矩阵的值,是归一化的输出值,M是卷积核的大小,i是从1遍历到M的数值,∑是求和符号,←是把当前元素进行赋值;xi是批量归一化层的输入;
公式5中的μB,σB是由公式67决定,xi是当前层的输入,也是上一层的输出;
步骤1.4引入线性整流函数激活函数:
模型中需要使用的神经网络需要激活函数,其中采用leaky线性整流函数激活函数,主要来解决传统Relu激活函数的梯度消失的问题,其计算方式如式
y=max(0,x)+leaky*min(0,x)
(9)
其中max是一个求最大值的函数,x是Dropout层的输出,也是激活函数的输入,y是经激活函数处理的输出,不是带G所生成的背景图片,leaky是一个0-1的系数,min是求最小值的函数;
步骤1.5引入Dropout层
Dropout层输入的像素值进行随机丢弃部分像素值,然后输入到下一层,Dropout层参数设置为0.2,即随机丢弃20%的像素点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖北医药学院,未经湖北医药学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010984112.0/1.html,转载请声明来源钻瓜专利网。