[发明专利]网络结构搜索的方法及装置、计算机存储介质和计算机程序产品在审
申请号: | 201980009276.7 | 申请日: | 2019-05-31 |
公开(公告)号: | CN111684472A | 公开(公告)日: | 2020-09-18 |
发明(设计)人: | 蒋阳;庞磊;胡湛 | 申请(专利权)人: | 深圳市大疆创新科技有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06N20/00 |
代理公司: | 北京励诚知识产权代理有限公司 11647 | 代理人: | 赵爽 |
地址: | 518057 广东省深圳市南山区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网络 结构 搜索 方法 装置 计算机 存储 介质 程序 产品 | ||
1.一种网络结构搜索的方法,其特征在于,包括:
定义搜索空间步骤:确定待进行网络结构搜索的神经网络模型的搜索空间,所述搜索空间定义了所述神经网络模型中每两个节点之间的操作层上的多种操作;
预训练步骤:根据第一网络结构以所述第一网络结构的预设参数训练所述搜索空间的总图以得到具有预训练参数的所述总图,所述总图由所述操作构成;
训练步骤:根据所述第一网络结构训练具有所述预训练参数的所述总图和根据所述第一网络结构的反馈量更新所述第一网络结构。
2.根据权利要求1所述的网络结构搜索的方法,其特征在于,所述预训练步骤,包括:
根据所述第一网络结构以所述第一网络结构的预设参数在所述搜索空间的每个所述操作层采样一个所述操作以得到所述总图的一个子图;
利用训练集的一批训练数据训练所述总图的子图以得到具有所述预训练参数的所述总图。
3.根据权利要求1所述的网络结构搜索的方法,其特征在于,所述训练步骤包括:
训练总图步骤:根据所述第一网络结构训练具有所述预训练参数的所述总图;
训练第一网络结构步骤:确定所述反馈量并根据所述反馈量更新所述第一网络结构。
4.根据权利要求3所述的网络结构搜索的方法,其特征在于,所述训练总图步骤和所述训练第一网络结构步骤迭代进行。
5.根据权利要求3所述的网络结构搜索的方法,其特征在于,所述训练总图步骤包括:
根据所述第一网络结构在所述搜索空间的每个所述操作层采样一个所述操作以得到具有所述预训练参数的所述总图的一个子图;
利用训练集的一批训练数据训练所述子图。
6.根据权利要求3所述的网络结构搜索的方法,其特征在于,所述训练第一网络结构步骤循环预设次数,根据所述反馈量更新所述第一网络结构,包括:
利用每次循环确定的所述反馈量更新所述第一网络结构,每次循环确定的所述反馈量的数量为预设数量。
7.根据权利要求6所述的网络结构搜索的方法,其特征在于,确定所述反馈量,包括:
根据所述第一网络结构在所述搜索空间的每个所述操作层采样一个所述操作以得到第二网络结构;
利用测试集的一批测试数据预测所述第二网络结构以确定所述反馈量。
8.根据权利要求6所述的网络结构搜索方法,其特征在于,所述第一网络结构是根据长短期记忆网络模型来构建,根据所述反馈量更新所述第一网络结构,通过以下条件式实现:
其中,Rk为第k个所述反馈量,θc为所述长短期记忆网络模型的参数,at为在第t个所述操作层采样到的所述操作,P(at|a(t-1):1;θc)为采样到所述操作的概率,m为所述反馈量的总数,T为所述第一网络结构预测的超参数的数量。
9.一种网络结构搜索的装置,其特征在于,包括处理器和存储器,所述存储器存储有一个或多个程序,在所述程序被处理器执行的情况下,使得所述处理器用于执行:
定义搜索空间步骤:确定待进行网络结构搜索的神经网络模型的搜索空间,所述搜索空间定义了所述神经网络模型中每两个节点之间的操作层上的多种操作;
预训练步骤:根据第一网络结构以所述第一网络结构的预设参数训练所述搜索空间的总图以得到具有预训练参数的所述总图,所述总图由所述操作构成;
训练步骤:根据所述第一网络结构训练具有所述预训练参数的所述总图和根据所述第一网络结构的反馈量更新所述第一网络结构。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市大疆创新科技有限公司,未经深圳市大疆创新科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980009276.7/1.html,转载请声明来源钻瓜专利网。