[发明专利]三维神经网络处理方法及图像处理方法、系统和存储介质在审

专利信息
申请号: 202310329084.2 申请日: 2023-03-28
公开(公告)号: CN116343009A 公开(公告)日: 2023-06-27
发明(设计)人: 钱平;韩睿;王文浩;郑一鸣;谢凌东;李富强;李特;蒋鹏;姜雄伟;李斐然;刘爽;宫磊;周学海;李曦;钱佳明 申请(专利权)人: 国网浙江省电力有限公司电力科学研究院;中国科学技术大学苏州高等研究院;国网浙江省电力有限公司宁波供电公司
主分类号: G06V10/82 分类号: G06V10/82;G06N3/0495;G06N3/0464;G06N3/045
代理公司: 浙江翔隆专利事务所(普通合伙) 33206 代理人: 许守金
地址: 310014 浙江*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 三维 神经网络 处理 方法 图像 系统 存储 介质
【说明书】:

发明公开了三维神经网络处理方法及图像处理方法、系统和存储介质,属于神经网络以及图像处理技术领域。本发明的一种基于分块循环矩阵的三维神经网络处理方法,通过构建分块循环矩阵模型、计算加速模型、全频域模型,克服以往剪枝等模型压缩方法存在的访存、计算不规则等问题,提出使用分块循环矩阵对三维神经网络3D CNN进行压缩,并且进一步利用快速傅立叶变换FFT加速计算,在保持模型结构规则的前提下,取得了显著的存储和计算压缩效果。在此基础上,引入频域内的激活、批归一化和池化操作,进一步消除由于快速傅立叶变换FFT带来的频繁的时域/频域切换开销,从而实现了全频域计算,进一步降低了3D CNN模型推理时的计算开销。

技术领域

本发明涉及三维神经网络处理方法及图像处理方法、系统和存储介质,属于神经网络以及图像处理技术领域。

背景技术

随着大数据时代的来临和计算机运算能力的提高,二维神经网络即2D CNN在图像分类方面取得了最先进的精度。然而,在处理视频等高维数据时,基于图像的2D CNN无法对其中的时间信息和运动模式进行建模,因此无法取得令人满意的效果。为了实现对视频等高维数据的精确分类,研究人员提出使用三维卷积来捕获视频等数据中的时空信息。2010年,Ji等人首次提出了三维卷积神经网络,其在相邻的图像帧上执行三维卷积以提取时间和空间维度上的特征。随后,Tran等人提出了一个现代意义上的深度架构C3D,C3D相对于以往的三维神经网络即3D CNN具有更深的层,故而可以在大规模数据集上进行学习并取得最优的结果。此后,3D CNN在视频分析、三维几何数据分析、三维医学图像诊断方面取得了巨大的成功。然而,与算法性能提升相对应的是3D CNN显著增加的模型尺寸和计算量。例如,在网络结构相同的情况下,3D ResNet34的参数数目和计算量分别为63.5M和36.7GFLOPs,是2D ResNet34(参数数目21.5M,计算量3.5GFLOPs)的2.95倍和10.49倍。相比于2D CNN,3DCNN额外增加了时间维度以捕获时域特征,因而存在更为庞大的存算开销。因此,如何高性能、低功耗地部署3D CNN,是目前学术界和工业界的研究热点。

为了解决这个问题,研究者开始在算法层面采用模型压缩方法对3D CNN的存储和计算开销进行优化,目前常用的模型压缩方法包括剪枝、量化、低秩分解以及快速算法。剪枝通常寻找一种评判指标来判断参数的重要性,将不重要的参数剪去,以减少模型的冗余,其往往能带来一个较高的压缩比。然而,此类方法通常伴随着微调、重训练等过程,显著加重了三维卷积神经网络的训练负担,除此之外,剪枝还会造成非零元素的不规则分布,引起访存不规则、计算负载不均衡等问题,对硬件实现不友好。参数量化可以有效降低计算资源消耗、片上存储开销和片外访存的压力,但量化过程往往会造成巨大的精度损失,且其对计算强度的压缩效果并不明显。

因此量化一般作为一种辅助的压缩方法出现。低秩分解使用多个低秩矩阵来逼近高维张量,常见的分解方式包括CP分解、SVD分解、Tucker分解以及Tensor-Train分解,低秩分解可以显著降低模型推理时的计算复杂度,但其涉及计算成本高昂的分解操作,且需要大量的重训练来达到收敛,对本已非常耗时的3D CNN训练来说是无法接受的。

可用于加速卷积的快速算法包括快速傅立叶变换FFT和Winograd,此类算法先通过某种变换(快速傅立叶变换FFT或者Winograd变换)将特征图和权重变换到另一个域,然后在另一个域上进行计算,最后再将计算结果变换回原先的域。然而,前述方法可以有效降低模型的计算量,但却无法减少模型的参数数目。此外,Winograd和快速傅立叶变换FFT算法受卷积尺寸、步长的影响较大,例如两者都无法加速1×1×1卷积,而这在现代网络中占据了主要计算量,如3D ResNet、3D MobileNet。

总而言之,上述方法仍未妥善解决3D CNN的处理效率问题,使其在能效/资源受限场景下的部署仍面临严峻的性能和能效挑战。

发明内容

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网浙江省电力有限公司电力科学研究院;中国科学技术大学苏州高等研究院;国网浙江省电力有限公司宁波供电公司,未经国网浙江省电力有限公司电力科学研究院;中国科学技术大学苏州高等研究院;国网浙江省电力有限公司宁波供电公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202310329084.2/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top