[发明专利]一种卷积神经网络模型设计空间McaNetX及其优化方法在审
申请号: | 202210176263.2 | 申请日: | 2022-02-25 |
公开(公告)号: | CN114492766A | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 王青禄;俞翔;陈逸霖;张宇;郭展希;陆耀欢;陆媛媛;王权林;罗栋楠 | 申请(专利权)人: | 南京工程学院 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06V10/44 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 徐激波 |
地址: | 211167 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 卷积 神经网络 模型 设计 空间 mcanetx 及其 优化 方法 | ||
本发明提供了一种卷积神经网络模型设计空间McaNetX及其优化方法,所述优化方法包括以下步骤:1)根据SAR图像的特点设计特征提取网络的基础结构并将基础结构使用结构参数表示;2)利用设计空间样本分析工具分析步骤1)中的结构参数规律;3)整体评判设计空间样本模型的性能,比较性能的变化;4)通过步骤2)中的结构参数变化规律对设计空间集合McaNetX进行优化。本文提出的基于设计空间优化方法设计的网络结构能够在轻量化模型上完成SAR图像的目标识别任务,且具有较强的鲁棒性以及泛化能力。
技术领域
本发明涉及图像目标识别领域,具体为一种卷积神经网络模型设计空间McaNetX及其优化方法。
背景技术
SAR图像识别问题的传统方法依赖于设计特征提取算法与分类器的选择。目前主要的SAR图像目标识别算法包括基于模板匹配的方法、基于Boosting的方法、基于稀疏矩阵表示的方法等,这些方法的精度取决于于人工设计的算法是否合适,且易受相干斑噪声、方位角、俯仰角等因素影响,针对不同的SAR图像特征往往需要重新设计特征提取算法。目前选择分类器的主流方法是利用支持向量机(Support Vector Machine,SVM)等面向光学图像设计的分类器,人工选取分类效果较好的分类器来适应从SAR图像中提取的特征,分类器与特征的关联程度低。
SAR图像目标识别的深度学习方法可通过设计神经网络结构的方式来提高识别SAR图像的能力,从而避免设计复杂的特征提取器。目前针对于SAR图像目标识别的神经网络大多是手工设计的,需要较高的人力成本。
神经网络结构的设计规律可在一定程度上向其他应用方向推广。深度卷积神经网络的结构特点是神经网络不可或缺的一部分,卷积神经网络的卷积核、参数量大小、深度和残差结构都影响着神经网络的性能水平。LeNet、AlexNet、ResNet等具有创造性思路的神经网络结构的提出显著影响了后续研究者设计网络的规律。因此,已被证明具有良好效果的神经网络结构不但是一种特定的网络实例,而且是一种可以推广和应用于其他网络的设计规律。
手工设计与NAS(Neural Architecture Search)设计网络均存在一定的局限性。在设计卷积神经网络的过程中,针对不同的数据集,神经网络提取与融合特征的方式也不同,因此手工设计网络的挑战是设计网络的过程复杂且考验专业能力。NAS在网络设计的过程中可以自动地从搜索空间中搜索到性能良好的网络结构,其自动化的特点显著降低了神经网络的设计成本与人力成本,但搜索结果是单种网络调优到特定的设置,网络搜索的过程中不会显示网络的设计规律。
发明内容
为解决上述背景技术中提出的问题,本发明提供了一种卷积神经网络模型设计空间McaNetX及其优化方法,所述优化方法包括以下步骤:1)根据SAR图像的特点设计特征提取网络的基础结构并将基础结构使用结构参数表示;2)利用设计空间样本分析工具分析步骤1)中的结构参数规律;3)整体评判设计空间样本模型的性能,比较性能的变化;4)通过步骤2)中的结构参数变化规律对设计空间集合McaNetX进行优化。
此处分析的结构参数规律是一批量的模型通过统计、概括的手段获取结构参数规律的过程。设计空间是由大量模型组成的集合,设计空间的结构参数规律在宏观角度调控着每个模型的结构。以Depth(每个Stage的Block数量,可以近似理解为网络深度)为例,如果利用设计空间样本分析工具分析每个Stage的平均Depth值的为1,3,2,1;那么结构参数规律就可以被概括为“升降升”。可以认为McaNetX是本文中所有设计空间的并集(实际上就是McaNetXA设计空间,参见图5),设计规律在其中充当限制条件的角色,而每一个结构参数都有其对应的设计规律。
“设计空间”是在结构参数规律的限制下理论上存在的模型全部集合,而“模型”是训练的最小单位,即基于梯度下降法训练的深度学习的神经网络模型(网络结构+有效权重)。“样本模型”是指从设计空间随机采样的一批模型集合,用以代表该设计空间的性能,但不等于设计空间。“设计空间集合”是本文提出的所有设计空间的并集,即理论上存在的所有模型的集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京工程学院,未经南京工程学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210176263.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种航空设备电路板焊接装置
- 下一篇:一种异形航空配件打磨装置