[发明专利]一种应用于图片多属性预测的神经网络结构搜索方法在审

申请号：	201810802108.0	申请日：	2018-07-20
公开（公告）号：	CN109063759A	公开（公告）日：	2018-12-21
发明（设计）人：	黄思羽;李玺;张仲非	申请（专利权）人：	浙江大学
主分类号：	G06K9/62	分类号：	G06K9/62;G06N3/02
代理公司：	杭州宇信知识产权代理事务所(普通合伙) 33231	代理人：	王健
地址：	310058 浙江***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	神经网络结构预测训练神经网络搜索图片输入图片贪心搜索训练目标预测数据自动搜索鲁棒性样本应用
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种应用于图片多属性预测的神经网络结构搜索方法，用于在图片多属性预测问题中搜索最优的神经网络结构。具体包括如下步骤：获取用于训练神经网络的图片多属性预测数据集，并定义训练目标；贪心搜索最优的神经网络结构；重新训练神经网络的参数，并预测新的输入图片样本的属性。本发明适用于真实图片多属性预测问题的神经网络结构的自动搜索，面对各类复杂情况具有较佳的效果和鲁棒性。

技术领域

本发明属于计算机视觉领域，特别地涉及一种应用于图像处理中图片多属性预测的神经网络结构搜索方法。

背景技术

图片多属性预测是计算机视觉领域的研究者长期重点关注的课题，该问题在目标跟踪、目标检测、身份识别等具体应用上具有广泛的实际应用价值。但同样，该问题具有较大的挑战性。一是其多个属性之间常具有较高的相关性，算法需要建模属性间的相关性以提高性能。二是算法建模属性相关性的同时需要合理保留各属性的不同信息，以提高模型的判别能力。

目前的图片属性预测方法主要可以分为基于传统计算机视觉技术的多属性预测方法和基于深度学习技术的多属性预测方法。近年来，基于深度学习技术的图片属性预测方法展现出良好的性能与鲁棒性，主要原因是其能够对原始输入图片进行深度多层次的特征信息提取。然而，该种方法主要存在以下几个问题：1)通常深度神经网络的结构是由专家基于领域特有的专业知识所设计，缺乏对不同任务的泛化能力，当面临不同任务时需要重新制定深度神经网络的结构；2)需要设计者拥有丰富的神经网络设计与参数调整经验，一个好的神经网络结构通常需要设计者的精心调整，这个过程将花费设计者大量的时间与精力。

发明内容

为解决上述问题，本发明的目的在于提供一种应用于图像处理领域中图片多属性预测的神经网络结构搜索方法。该方法基于贪心的搜索策略，可高效地自动搜索给定任务的最优神经网络模型结构，面对各类复杂情况具有较佳的效果和鲁棒性。

为实现上述目的，本发明的技术方案为：

一种应用于图片多属性预测的神经网络结构搜索方法，包括以下步骤：

S1、获取用于训练神经网络的图片多属性预测数据集，并定义训练目标；

S2、贪心搜索最优的神经网络结构；

S3、重新训练神经网络的参数，并预测新的输入图片样本的属性。

进一步的，所述的用于训练神经网络模型的图片多属性预测数据集为含有训练数据集D_train和验证数据集D_valid的图片多属性预测数据集，指定的神经网络层数M，以及每层的神经网络单元数目B_l，l＝1，2，...，M；

定义训练目标为：预测目标样本的属性值。

进一步的，步骤S2中，贪心搜索最优的神经网络结构具体包括：

S21、随机初始化符合公式(1)条件的树型神经网络结构A

其中表示神经网络中第l层第i个单元和第l+1层第j个单元有连接，反之