[发明专利]三维神经网络处理方法及图像处理方法、系统和存储介质在审

申请号：	202310329084.2	申请日：	2023-03-28
公开（公告）号：	CN116343009A	公开（公告）日：	2023-06-27
发明（设计）人：	钱平;韩睿;王文浩;郑一鸣;谢凌东;李富强;李特;蒋鹏;姜雄伟;李斐然;刘爽;宫磊;周学海;李曦;钱佳明	申请（专利权）人：	国网浙江省电力有限公司电力科学研究院;中国科学技术大学苏州高等研究院;国网浙江省电力有限公司宁波供电公司
主分类号：	G06V10/82	分类号：	G06V10/82;G06N3/0495;G06N3/0464;G06N3/045
代理公司：	浙江翔隆专利事务所(普通合伙) 33206	代理人：	许守金
地址：	310014 浙江***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	三维神经网络处理方法图像系统存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了三维神经网络处理方法及图像处理方法、系统和存储介质，属于神经网络以及图像处理技术领域。本发明的一种基于分块循环矩阵的三维神经网络处理方法，通过构建分块循环矩阵模型、计算加速模型、全频域模型，克服以往剪枝等模型压缩方法存在的访存、计算不规则等问题，提出使用分块循环矩阵对三维神经网络3D CNN进行压缩，并且进一步利用快速傅立叶变换FFT加速计算，在保持模型结构规则的前提下，取得了显著的存储和计算压缩效果。在此基础上，引入频域内的激活、批归一化和池化操作，进一步消除由于快速傅立叶变换FFT带来的频繁的时域/频域切换开销，从而实现了全频域计算，进一步降低了3D CNN模型推理时的计算开销。

技术领域

本发明涉及三维神经网络处理方法及图像处理方法、系统和存储介质，属于神经网络以及图像处理技术领域。

背景技术

随着大数据时代的来临和计算机运算能力的提高，二维神经网络即2D CNN在图像分类方面取得了最先进的精度。然而，在处理视频等高维数据时，基于图像的2D CNN无法对其中的时间信息和运动模式进行建模，因此无法取得令人满意的效果。为了实现对视频等高维数据的精确分类，研究人员提出使用三维卷积来捕获视频等数据中的时空信息。2010年，Ji等人首次提出了三维卷积神经网络，其在相邻的图像帧上执行三维卷积以提取时间和空间维度上的特征。随后，Tran等人提出了一个现代意义上的深度架构C3D，C3D相对于以往的三维神经网络即3D CNN具有更深的层，故而可以在大规模数据集上进行学习并取得最优的结果。此后，3D CNN在视频分析、三维几何数据分析、三维医学图像诊断方面取得了巨大的成功。然而，与算法性能提升相对应的是3D CNN显著增加的模型尺寸和计算量。例如，在网络结构相同的情况下，3D ResNet34的参数数目和计算量分别为63.5M和36.7GFLOPs，是2D ResNet34(参数数目21.5M，计算量3.5GFLOPs)的2.95倍和10.49倍。相比于2D CNN，3DCNN额外增加了时间维度以捕获时域特征，因而存在更为庞大的存算开销。因此，如何高性能、低功耗地部署3D CNN，是目前学术界和工业界的研究热点。

为了解决这个问题，研究者开始在算法层面采用模型压缩方法对3D CNN的存储和计算开销进行优化，目前常用的模型压缩方法包括剪枝、量化、低秩分解以及快速算法。剪枝通常寻找一种评判指标来判断参数的重要性，将不重要的参数剪去，以减少模型的冗余，其往往能带来一个较高的压缩比。然而，此类方法通常伴随着微调、重训练等过程，显著加重了三维卷积神经网络的训练负担，除此之外，剪枝还会造成非零元素的不规则分布，引起访存不规则、计算负载不均衡等问题，对硬件实现不友好。参数量化可以有效降低计算资源消耗、片上存储开销和片外访存的压力，但量化过程往往会造成巨大的精度损失，且其对计算强度的压缩效果并不明显。

因此量化一般作为一种辅助的压缩方法出现。低秩分解使用多个低秩矩阵来逼近高维张量，常见的分解方式包括CP分解、SVD分解、Tucker分解以及Tensor-Train分解，低秩分解可以显著降低模型推理时的计算复杂度，但其涉及计算成本高昂的分解操作，且需要大量的重训练来达到收敛，对本已非常耗时的3D CNN训练来说是无法接受的。

可用于加速卷积的快速算法包括快速傅立叶变换FFT和Winograd，此类算法先通过某种变换(快速傅立叶变换FFT或者Winograd变换)将特征图和权重变换到另一个域，然后在另一个域上进行计算，最后再将计算结果变换回原先的域。然而，前述方法可以有效降低模型的计算量，但却无法减少模型的参数数目。此外，Winograd和快速傅立叶变换FFT算法受卷积尺寸、步长的影响较大，例如两者都无法加速1×1×1卷积，而这在现代网络中占据了主要计算量，如3D ResNet、3D MobileNet。

总而言之，上述方法仍未妥善解决3D CNN的处理效率问题，使其在能效/资源受限场景下的部署仍面临严峻的性能和能效挑战。

发明内容

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于国网浙江省电力有限公司电力科学研究院;中国科学技术大学苏州高等研究院;国网浙江省电力有限公司宁波供电公司，未经国网浙江省电力有限公司电力科学研究院;中国科学技术大学苏州高等研究院;国网浙江省电力有限公司宁波供电公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202310329084.2/2.html，转载请声明来源钻瓜专利网。

上一篇：一种老年人的身体康复与护理一体化装置
下一篇：一种废弃矿井储气库密封装置

同类专利

专利分类

G 物理

G06 计算；推算；计数

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]三维神经网络处理方法及图像处理方法、系统和存储介质在审

专利文献下载