[发明专利]网络结构搜索的方法及装置、计算机存储介质和计算机程序产品在审
申请号: | 201980009246.6 | 申请日: | 2019-05-31 |
公开(公告)号: | CN111656365A | 公开(公告)日: | 2020-09-11 |
发明(设计)人: | 蒋阳;庞磊;胡湛 | 申请(专利权)人: | 深圳市大疆创新科技有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 北京励诚知识产权代理有限公司 11647 | 代理人: | 赵爽 |
地址: | 518057 广东省深圳市南山区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网络 结构 搜索 方法 装置 计算机 存储 介质 程序 产品 | ||
1.一种网络结构搜索的方法,其特征在于,包括:
确定待进行网络结构搜索的神经网络模型的搜索空间,所述搜索空间定义了所述神经网络模型中每两个节点之间的操作层上的多种操作;
根据第一网络结构在所述搜索空间的每个所述操作层采样一个所述操作以得到目标网络结构;
低比特化所述目标网络结构以得到第二网络结构;
确定所述第二网络结构的反馈量;
根据所述反馈量更新所述第一网络结构。
2.根据权利要求1所述的网络结构搜索的方法,其特征在于,确定所述第二网络结构的反馈量,包括:
将所述第二网络结构训练至收敛以确定所述反馈量。
3.根据权利要求2所述的网络结构搜索的方法,其特征在于,将所述第二网络结构训练至收敛以确定所述反馈量,包括:
利用训练集将所述第二网络结构训练至收敛;
利用测试集预测收敛后的所述第二网络结构以确定所述反馈量。
4.根据权利要求1所述的网络结构搜索的方法,其特征在于,确定所述第二网络结构的反馈量,包括:
根据所述第二网络结构确定所述反馈量,所述第二网络结构未被训练至收敛。
5.根据权利要求4所述的网络结构搜索的方法,其特征在于,根据第一网络结构在所述搜索空间的每个所述操作层采样一个所述操作以得到目标网络结构,包括:
利用训练集训练所述搜索空间的总图,所述总图由所述操作连接而成;
根据第一网络结构对训练后的所述总图进行采样以得到所述目标网络结构;
根据所述第二网络结构确定所述反馈量,包括:
利用测试集预测所述第二网络结构以确定所述反馈量。
6.根据权利要求5所述的网络结构搜索的方法,其特征在于,利用训练集训练所述搜索空间的总图,包括:
在所述搜索空间的每个所述操作层采样一个所述操作以得到所述总图的子图;
利用所述训练集的一批数据训练所述子图。
7.根据权利要求1所述的网络结构搜索的方法,其特征在于,所述第一网络结构是根据长短期记忆人工神经网络来构建,根据所述反馈量更新所述第一网络结构,通过以下公式实现:
其中,Rk为第k个所述反馈量,θc为所述长短期记忆人工神经网络的参数,at为在第t个所述操作层采样到的所述操作,为采样到所述操作的概率。m为所述反馈量的总数量,T为所述第一网络结构预测的超参数的数量。
8.根据权利要求1所述的网络结构搜索的方法,其特征在于,所述第一网络结构是根据长短期记忆人工神经网络来构建,所述搜索空间的每个所述操作层对应于所述长短期记忆人工神经网络的一个时间步,对于每个所述时间步,所述长短期记忆人工神经网络的细胞输出一个隐状态,根据第一网络结构在所述搜索空间的每个所述操作层采样一个所述操作以得到目标网络结构,包括:
将所述隐状态映射为特征向量,所述特征向量的维度与每个所述操作层上的操作数量相同;
根据所述特征向量在每个所述操作层采样一个所述操作以得到所述目标网络结构。
9.根据权利要求8所述的网络结构搜索的方法,其特征在于,根据所述特征向量在每个所述操作层采样一个所述操作以得到所述目标网络结构,包括:
将所述特征向量进行归一化以得到每个所述操作层的每个所述操作的概率;
根据所述概率在每个所述操作层采样一个所述操作以得到所述目标网络结构。
10.根据权利要求1所述的网络结构搜索的方法,其特征在于,所述第一网络结构根据卷积神经网络或循环神经网络构建。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市大疆创新科技有限公司,未经深圳市大疆创新科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980009246.6/1.html,转载请声明来源钻瓜专利网。