[发明专利]一种解耦合的网络结构搜索方法、设备及可读存储介质有效
申请号: | 202110609293.3 | 申请日: | 2021-06-01 |
公开(公告)号: | CN113255892B | 公开(公告)日: | 2023-09-05 |
发明(设计)人: | 戴文睿;廖列文;李成林;邹君妮;熊红凯 | 申请(专利权)人: | 上海交通大学烟台信息技术研究院 |
主分类号: | G06N3/082 | 分类号: | G06N3/082;G06V10/764 |
代理公司: | 上海恒慧知识产权代理事务所(特殊普通合伙) 31317 | 代理人: | 徐红银 |
地址: | 264003 山东省烟台*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 耦合 网络 结构 搜索 方法 设备 可读 存储 介质 | ||
1.一种图像目标检测方法,其特征在于,包括:
获取用于目标检测的图像训练数据;
采用网络结构搜索方法对超网络进行训练,得到目标检测用的搜索结果神经网络;
采用所述搜索结果神经网络对待检测的图像数据进行检测,得到图像目标检测结果;
其中:所述采用网络结构搜索方法对超网络进行训练,得到目标检测用的搜索结果神经网络,包括:
S1,利用基本单元构建网络结构搜索模型的超网络,所述超网络是包含所有候选操作和侯选边的基本单元堆叠成的用于搜索网络结构的原始神经网络,所述基本单元包括普通单元和归约单元,普通单元的输出维度与输入维度一致,归约单元的输出维度为输入维度的一半;
S2,将所述超网络解耦成为若干只包含一种候选操作的单一操作子网络,单一操作子网络的数量等于候选操作种类数,这些单一操作子网络与所述超网络共享拓扑结构;
S3,获取图像数据,将所述图像数据分成两部分,其中,第一部分图像数据所占比例不低于50%,作为所述超网络及单一操作子网络的网络参数的训练数据,将这部分图像训练数据输入到网络参数更新模块;第二部分图像数据作为所述超网络的结构参数更新的训练数据,将这部分图像训练数据输入到结构参数更新模块;
S4,网络参数更新模块将S3的第一部分图像数据通过所述单一操作子网络生成特征图,根据特征图和第一部分图像数据携带的已标注的类别信息,计算网络参数的交叉熵损失函数;对每一个通道计算模型通道丢弃率分布与模型稀疏先验分布之间的KL散度,所有通道的KL散度之和作为第一损失函数,利用梯度下降方法更新所述单一操作子网络的各通道丢弃概率进行通道剪枝;将所述第一损失函数和所述网络参数的交叉熵损失函数相加计算得到第二损失函数,然后利用梯度下降方法根据所述的第二损失函数对所述单一操作子网络进行训练,更新网络参数,得到剪枝更新的单一操作子网络;所述网络参数是指所有基本单元的候选操作内部的参数;
S5,结构参数更新模块将S4得到的剪枝更新后的单一操作子网络重新组建为超网络,以单一操作子网络的网络参数作为所述超网络中对应候选操作的网络参数,利用S3的第二部分图像数据计算超网络特征图,将结构参数的交叉熵损失函数作为第三损失函数,更新超网络结构参数;所述结构参数是指所有基本单元的候选边和候选操作的权重参数以及方差参数;
S6,将S5最终收敛得到的超网络结构参数输入到结构保留模块,计算得到最终保留的候选操作及候选边;将超网络结构参数代入到所述超网络的中所有基本单元里,保留参数值最大的候选操作以及保留操作为非零操作的边,得到新的超网络,并将更新得到的新的超网络作为网络结构搜索模型的最终网络,所述最终网络是包含选定的候选操作和选定的侯选边的新基本单元堆叠成的作为搜索结果的目标神经网络。
2.根据权利要求1所述的图像目标检测方法,其特征在于:所述结构参数更新模块是通过将剪枝更新的单一操作子网络重新组合成超网络,以单一操作子网络的网络参数作为所述超网络中对应候选操作的网络参数,以超网络中候选操作和候选边的结构参数的交叉熵作为第三损失函数,利用梯度下降对候选操作和候选边的结构参数分别进行迭代更新,直至收敛。
3.根据权利要求2所述的图像目标检测方法,其特征在于:网络参数和结构参数的更新是交替进行的,即在每次迭代中先更新网络参数,然后根据已更新网络参数的单一操作子网络来组成更新的超网络,用于更新结构参数,这样迭代直至收敛。
4.根据权利要求1所述的图像目标检测方法,其特征在于:所述通道剪枝包括:
对于所述单一操作子网络的每个通道采用均值为1和方差为δ的高斯分布作为参数化的通道丢弃率分布,按第一损失函数更新参数δ;
根据δ计算通道丢弃率p=δ/(1+δ),以1-p=1/(1+δ)作为期望建立伯努利分布q(ψ),从伯努利分布q(ψ)采样参数值ψ=0或ψ=1代入到所述单一操作子网络中,在所有基本单元里保留采样值为1的候选通道,丢弃采样值为0的候选通道,得到剪枝后的单一操作子网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学烟台信息技术研究院,未经上海交通大学烟台信息技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110609293.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种预制钢筋混凝土叠合楼板
- 下一篇:一种腔体滤波器的智能辅助调试方法及装置