[发明专利]一种应用于图片多属性预测的神经网络结构搜索方法在审
申请号: | 201810802108.0 | 申请日: | 2018-07-20 |
公开(公告)号: | CN109063759A | 公开(公告)日: | 2018-12-21 |
发明(设计)人: | 黄思羽;李玺;张仲非 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/02 |
代理公司: | 杭州宇信知识产权代理事务所(普通合伙) 33231 | 代理人: | 王健 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络结构 预测 训练神经网络 搜索 图片 输入图片 贪心搜索 训练目标 预测数据 自动搜索 鲁棒性 样本 应用 | ||
本发明公开了一种应用于图片多属性预测的神经网络结构搜索方法,用于在图片多属性预测问题中搜索最优的神经网络结构。具体包括如下步骤:获取用于训练神经网络的图片多属性预测数据集,并定义训练目标;贪心搜索最优的神经网络结构;重新训练神经网络的参数,并预测新的输入图片样本的属性。本发明适用于真实图片多属性预测问题的神经网络结构的自动搜索,面对各类复杂情况具有较佳的效果和鲁棒性。
技术领域
本发明属于计算机视觉领域,特别地涉及一种应用于图像处理中图片多属性预测的神经网络结构搜索方法。
背景技术
图片多属性预测是计算机视觉领域的研究者长期重点关注的课题,该问题在目标跟踪、目标检测、身份识别等具体应用上具有广泛的实际应用价值。但同样,该问题具有较大的挑战性。一是其多个属性之间常具有较高的相关性,算法需要建模属性间的相关性以提高性能。二是算法建模属性相关性的同时需要合理保留各属性的不同信息,以提高模型的判别能力。
目前的图片属性预测方法主要可以分为基于传统计算机视觉技术的多属性预测方法和基于深度学习技术的多属性预测方法。近年来,基于深度学习技术的图片属性预测方法展现出良好的性能与鲁棒性,主要原因是其能够对原始输入图片进行深度多层次的特征信息提取。然而,该种方法主要存在以下几个问题:1)通常深度神经网络的结构是由专家基于领域特有的专业知识所设计,缺乏对不同任务的泛化能力,当面临不同任务时需要重新制定深度神经网络的结构;2)需要设计者拥有丰富的神经网络设计与参数调整经验,一个好的神经网络结构通常需要设计者的精心调整,这个过程将花费设计者大量的时间与精力。
发明内容
为解决上述问题,本发明的目的在于提供一种应用于图像处理领域中图片多属性预测的神经网络结构搜索方法。该方法基于贪心的搜索策略,可高效地自动搜索给定任务的最优神经网络模型结构,面对各类复杂情况具有较佳的效果和鲁棒性。
为实现上述目的,本发明的技术方案为:
一种应用于图片多属性预测的神经网络结构搜索方法,包括以下步骤:
S1、获取用于训练神经网络的图片多属性预测数据集,并定义训练目标;
S2、贪心搜索最优的神经网络结构;
S3、重新训练神经网络的参数,并预测新的输入图片样本的属性。
进一步的,所述的用于训练神经网络模型的图片多属性预测数据集为含有训练数据集Dtrain和验证数据集Dvalid的图片多属性预测数据集,指定的神经网络层数M,以及每层的神经网络单元数目Bl,l=1,2,...,M;
定义训练目标为:预测目标样本的属性值。
进一步的,步骤S2中,贪心搜索最优的神经网络结构具体包括:
S21、随机初始化符合公式(1)条件的树型神经网络结构A
其中表示神经网络中第l层第i个单元和第l+1层第j个单元有连接,反之
S22、随机初始化对应A的神经网络参数W[A];
S23、循环遍历神经网络层l=1,2,...,M-1和每层的每个单元b=1,2,...,Bl,记为循环S;
S24、在循环S下,依照公式(2)重置神经网络第l层的结构
S25、在循环S下,使用随机梯度下降算法在训练数据集Dtrain上训练神经网络结构A对应的参数W[A];
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810802108.0/2.html,转载请声明来源钻瓜专利网。