[发明专利]基于Split LBI算法的自动网络增长方法在审

专利信息
申请号: 201911234579.7 申请日: 2019-12-05
公开(公告)号: CN112926723A 公开(公告)日: 2021-06-08
发明(设计)人: 付彦伟;李树昀;钟祖远 申请(专利权)人: 复旦大学;复卿(上海)智能科技有限公司
主分类号: G06N3/04 分类号: G06N3/04;G06N3/08
代理公司: 上海德昭知识产权代理有限公司 31204 代理人: 卢泓宇
地址: 200433 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 split lbi 算法 自动 网络 增长 方法
【说明书】:

发明提供一种基于Split LBI算法的自动网络增长方法,能够在训练过程中自动增长卷积神经网络的卷积层和各层卷积核,最终得到参数量较少但是在分类任务中表现很好的神经网络模型的方法。其具体分为两种方法,一是给定神经网络模型层结构的情况下,在训练过程中自动增长各卷积层的卷积核和线性层的线性单元,最终得到训练好的、总参数量比人工设计的模型更少的、训练总代价更少的模型;二是给定一个层数很少的网络结构,训练过程中,先自动增长卷积核来确定各模块的卷积核上限,然后自动增长卷积层,最终得到训练好的、在分类任务上表现很好的模型。

技术领域

本发明属于图像处理领域以及深度学习领域,涉及用于图像分类的卷积神经网络的结构设计,具体涉及一种基于Split LBI算法的自动网络增长方法。

背景技术

近年来,深卷积神经网络在计算视觉领域取得了不俗的成绩。计算机视觉和机器学习社区解决许多重要任务,如图像分类和图像分割,研究人员设计了许多成功的深层神经网络架构,从只有几个卷积层的神经网络,如LeNet[1]和AlexNet[2],到10层以上的神经网络,例如VGG[3]和GoogleLenet[4],甚至有成百上千层的ResNet[5]。在过去,人工设计神经网络结构需要非常强的专业知识、丰富的经验和很多的实验支持。网络的一些关键的超参数,例如层类型(卷积层,池化层等)、卷积层数量和卷积核数量(即,网络深度的宽度)等等。神经网络的表现性能很大程度上取决于总参数的数量、卷积层的数量和各层的卷积核数量,所以这些都是塑造神经网络表达能力的关键的超参数。

在机器学习社区中,大多数研究人员使用自动机器学习方法,例如神经架构自动化搜索(NAS)[6][7]。NAS方法确实在图像分类和对象等许多任务上超过了手工设计的架构,但是NAS的方法需要非常巨大的算力和时间,在很多场合下是不切实际的。此外,为了寻找一个好的架构,各种搜索策略已经被应用,如随机搜索,贝叶斯优化,强化学习,等等。另外也有自动增长神经网络卷积层的方法,但是其中大多数方法也需要大量的计算成本,不便于实际使用。

[1]Yann LeCun,Leon Bottou,Yoshua Bengio,and Patrick Haffner.Gradient-based learning applied to document recognition.Proceedings of the IEEE,1998.1

[2]Alex Krizhevsky,Ilya Sutskever,and Geoffrey E.Hinton.Imagenetclassification with deep convolutional neural networks.NIPS,2012.

[3]Karen Simonyan and Andrew Zisserman.Very deep convolutionalnetworks for large-scale image recognition.arXiv preprint arXiv:1409.1556,2014.

[4]Christian Szegedy,Wei Liu,Yangqing Jia,Pierre Sermanet,Scott Reed,Dragomir Anguelov,Dumitru Erhan,Vincent Vanhoucke,and Andrew Rabinovich.Goingdeeper with convolutions.Proceedings of the IEEE conference on computervision and pattern recognition(CVPR),2015.

[5]Kaiming He,Xiangyu Zhang,Shaoqing Ren,and Jian Sun.Deep residuallearning for image recognition.CVPR,2016a.

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学;复卿(上海)智能科技有限公司,未经复旦大学;复卿(上海)智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911234579.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top