[发明专利]一种神经网络架构搜索方法、系统、设备及可读存储介质在审
申请号: | 202210085746.1 | 申请日: | 2022-01-25 |
公开(公告)号: | CN114429197A | 公开(公告)日: | 2022-05-03 |
发明(设计)人: | 徐亦飞;王正洋;朱利;尉萍萍;王超勇;张越皖;张扬;徐明杰 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06V10/764;G06V10/82;G06K9/62 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 李鹏威 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 神经网络 架构 搜索 方法 系统 设备 可读 存储 介质 | ||
1.一种神经网络架构搜索方法,其特征在于,包括以下步骤:
S1,初始化DARTS网络的相关参数;
S2,将图像训练集输入至初始化后的DARTS网络中,根据目标函数计算损失值,根据梯度信息使用二阶泰勒展开式计算出网络损失变化,使用基于突触显著性的评分指标计算指标显著性;
S3,根据操作的显著性指标、网络损失变化和损失值解析计算最优Cell网络结构,根据得到的最优Cell网络结构堆叠形成搜索到的模型结构。
2.根据权利要求1所述的一种神经网络架构搜索方法,其特征在于,初始化的相关参数包括权重参数、架构参数、学习率和批大小。
3.根据权利要求1所述的一种神经网络架构搜索方法,其特征在于,采用R作为移除该操作所带来的网络损失变化
R=L(D,W,α,Sp)-L(D,W|(1-αkT)Sp)
其中D,W,α,Sp,k分别为数据集,网络参数,架构参数,搜索空间,所要移除的操作。
4.根据权利要求3所述的一种神经网络架构搜索方法,其特征在于,基于突触显著性的评分指标如公式(1)所示
α为架构参数。
5.根据权利要求3所述的一种神经网络架构搜索方法,其特征在于,采用二阶泰勒级数展开设计的网络损失变化R:
6.根据权利要求1所述的一种神经网络架构搜索方法,其特征在于,采用Cifar-10数据集作为训练集。
7.根据权利要求1所述的一种神经网络架构搜索方法,其特征在于,DARTS网络结构包括Normal Cell结构和Reduction Cell结构。
8.一种神经网络架构搜索系统,其特征在于,包括初始化模块,优化训练模块和搜索模块;
初始化模块,用于初始化DARTS网络的相关参数;
优化训练模块,用于根据初始化后的DARTS网络对图像训练集进行处理,根据目标函数计算损失值,根据梯度信息使用二阶泰勒展开式计算出网络损失变化,使用基于突触显著性的评分指标计算指标显著性,根据操作的显著性指标、网络损失变化和损失值解析计算最优Cell网络结构;
搜索模块,根据得到的最优Cell网络结构堆叠形成搜索到的模型结构。
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7任一项所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210085746.1/1.html,转载请声明来源钻瓜专利网。