[发明专利]一种基于深度卷积生成对抗网络的多类别多视图数据生成方法有效
| 申请号: | 201710813659.2 | 申请日: | 2017-09-11 |
| 公开(公告)号: | CN107609587B | 公开(公告)日: | 2020-08-18 |
| 发明(设计)人: | 宣琦;陈壮志;方宾伟;王金宝;刘毅 | 申请(专利权)人: | 浙江工业大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
| 地址: | 310014 浙江省杭*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 深度 卷积 生成 对抗 网络 类别 视图 数据 方法 | ||
1.一种基于深度卷积生成对抗网络的多类别多视图数据生成方法,其特征在于:包括以下步骤:
训练数据预处理阶段:
步骤1:中心剪裁:
在不影响图中物体的前提下,对每张图片进行中心剪裁;
步骤2:多视图叠合:
在图像的通道维度上对同一物体的多视图按顺序进行叠合,每个物体的所有多视图形成一份数据集;
步骤3:提取类别标签:
分别对步骤2后的每份数据集的类别进行onehot编码,获取对应的类别标签序列;
训练阶段:
步骤4:训练DC-GAN网络:
用相同的随机种子打乱图片数据和标签序列,用图片数据、标签序列和随机高维噪声训练DC-GAN网络,并测试;
数据生成阶段:
步骤5:获得多类别的生成数据:
输入目标类别的onehot标签和随机噪声,获得该类别的生成数据;调整标签信息,可获得不同类别的生成数据;
步骤6:获得多视图数据:
将步骤5中的生成数据重新剪裁为相应的多张视图,并添加背景扩大到原图片尺寸,成为与原数据集同规格的数据。
2.如权利要求1所述的一种基于深度卷积生成对抗网络的多类别多视图数据生成方法,其特征在于:所述训练阶段中,设计DC-GAN网络各层的规则如下:
DC-GAN的网络结构包含两部分:鉴别网络D和生成网络G,其中D网络输入训练数据或生成数据、onehot标签,输出鉴别值,其包含4个卷积层和一个单节点的输出全连接层,G网络输入高维随机噪声、onehot标签,输出生成数据,其包含一个输入全连接层和4个反卷积层。
3.如权利要求2所述的一种基于深度卷积生成对抗网络的多类别多视图数据生成方法,其特征在于:所述步骤4中,训练过程包括以下要点:
4.1)训练图片或生成图片输入D网络时,在图像的通道维度叠合当次训练图片的标签,并在之后的每个卷积层输入时,均使用标签信息增加输入的特征图feature map,在最后的全连接层前再次将标签信息连接到输入向量中;
4.2)高维随机噪声输入G网络时,在输入向量末尾连接标签信息,并在之后的每个反卷积层输入时,均使用标签信息增加输入的feature map。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710813659.2/1.html,转载请声明来源钻瓜专利网。





