[发明专利]一种基于注意力机制的神经网络正则化方法在审
申请号: | 202111216830.4 | 申请日: | 2021-10-19 |
公开(公告)号: | CN114092779A | 公开(公告)日: | 2022-02-25 |
发明(设计)人: | 李建军;李胜炎;周云帆;俞杰;陆奇;唐政;惠国宝;赵露露;田万勇;李新付 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06V10/82 | 分类号: | G06V10/82;G06K9/62;G06V10/764;G06V10/46;G06N3/04;G06N3/08;G06V10/26 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 注意力 机制 神经网络 正则 方法 | ||
本发明公开了一种基于注意力机制的神经网络正则化方法。本发明步骤:(1)批量图像输入和预处理;(2)利用CNN卷积神经网络进行特征提取;(3)利用注意力机制进行关键特征筛选;(4)交换不同目标图像的关键特征;(5)不同图像的关键特征和非关键特征共同组成重构图像的语义信息;(6)设计一种自适应置信度估计方法,判断重构图像的所属类别;(7)利用重构图像对神经网络进行训练得到更准确的训练模型。本发明通过样本拓充和充分挖掘图像的潜在特征,以提升模型的鲁棒性和整体性能。本发明的优势在于使用注意力机制指导图像特征自适应重构,适用范围广、模型精确度高、鲁棒性强。
技术领域
本发明涉及计算机视觉技术领域,涉及深度学习中的注意力机制与神经网络正则化方法,融合了特征重构与自适应置信度估计的方法。
背景技术
近年来,随着深度神经网络的发展,目标识别、语义分割、图文说明等领域深度学习任务越来越复杂化和多样化。面对复杂的任务,更宽的宽度和更深的模型往往会具有更强的表达能力。然而,越大的模型意味着越多的参数量,这需要更多的计算机资源:内存占用、参数、操作计数、推理时间和功耗等。
特别地,当神经网络达到一定深度后,由于过拟合等原因,精度不再随着深度加深而提升。而越大的模型过越容易拟合,归根结底的原因就是数据样本少、数据完备性不足或难以支撑巨大参数的优化,从而导致训练精度高而测试精度过低的现象。因此,网络正则化技术是一种很好提升模型鲁棒性和整体性能的方法。
发明内容
本发明的目的是针对复杂模型训练时由于数据完备性不足而容易引发的过拟合问题,本发明设计了一种基于注意力机制的神经网络正则化方法,旨在进行样本拓充和充分挖掘图像的潜在特征,以提升模型的鲁棒性和整体性能。首先通过CNN卷积神经网络获取图像语义信息,然后利用注意力机制对图像的关键特征进行筛选和提取,再引入一种自适应置信度估计方法指导不同图像的关键特征进行重构,最后利用重构特征图对神经网络进行训练,以得到更好的训练结果。本发明的优势在于使用注意力机制指导图像特征自适应重构,适用范围广、模型精确度高、鲁棒性强。
为实现以上的目的,本发明是通过以下技术方案来实现的:
步骤1、批量图像的预处理:包括随机裁剪、随机翻转、正则化操作;
步骤2、利用权重共享的编码器网络进行特征提取:将预处理后的训练图像输入Resnet模型,从Resnet模型的任意中间层提取高维特征图,该中间层之前的网络即是权重共享的编码器网络,提取到的高维特征图将用于之后的特征重构,特征重构后的特征图将重新输入该中间层之后的网络进行训练;
步骤3、利用注意力机制进行关键特征筛选:通过步骤2骤得到高维特征图,将这些高维特征图输入注意力提取网络SENet,利用注意力机制筛选并提取特征图中的关键特征;
步骤4、交换不同目标图像的关键特征:随机选取一张特征图上的关键特征替换另一特征图上的关键特征,得到一张新的重构特征图,该重构特征图包含了两张图像目标的信息;
步骤5、当前图像的关键特征和另一图像的补充特征共同组成重构图像的语义信息:重构特征图包含了一张特征图上的关键特征和另一特征图上的补充特征;
步骤6、设计一种自适应置信度估计方法,判断重构图像的所属类别:新的重构特征图包含了两张图像的目标信息,利用自适应置信度估计的方法,评估重构特征图所属目标类别的概率大小;
步骤7、利用重构图像对神经网络进行训练得到更准确的训练模型:通过上述步骤得到了重构特征图及其标签,因此可以使用重构的特征图进行网络训练,充分挖掘神经网络的学习潜力,增强模型鲁棒性。
经过测试,本发明与之前的网络正则化方法相比具有的优势是:
1.利用注意力机制,自适应筛选与重组特征,将注意力机制融入神经网络正则化方法中;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111216830.4/2.html,转载请声明来源钻瓜专利网。