[发明专利]一种基于多维张量字典学习算法的图像处理方法在审
申请号: | 201711403739.7 | 申请日: | 2017-12-22 |
公开(公告)号: | CN108305297A | 公开(公告)日: | 2018-07-20 |
发明(设计)人: | 姜飞;申瑞民 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06T9/00 | 分类号: | G06T9/00 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 翁惠瑜 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 稀疏编码 算法 图像处理 多维信号 字典学习 求解 多维 字典 空间结构 计算复杂度 固定字典 计算效率 交替迭代 模型获得 求解算法 稀疏表示 维度 优化 | ||
本发明涉及一种基于多维张量字典学习算法的图像处理方法,该方法将多维信号以张量表达实现图像处理;所述张量表达过程为:通过求解一张量稀疏编码模型获得张量字典及相应的张量系数,获得与输入的多维信号相应的张量。本发明采用基于交替迭代优化的有效求解算法进行张量稀疏编码模型的求解,包括固定字典求稀疏表示算法和固定稀疏编码求字典的算法。与现有技术相比,本发明提出的张量稀疏编码模型,在保持数据本身的空间结构的同时考虑各个维度之间的相关性,具有计算复杂度低、计算效率高等优点。
技术领域
本发明涉及图像处理技术领域,尤其是涉及一种基于多维张量字典学习算法的图像处理方法。
背景技术
图像处理一直是视觉、人工智能、机器学习等领域的研究热点。随着电子设备的不断升级,图像数据呈现出高维多通道等特性,增加了图像处理的难度。稀疏编码作为高维数据的一种经典描述方法,将数据简洁的表达为少量基本元素的叠加,能够有效的降低数据的维数,同时保留数据的本质特征,已在图像特征提取、图像去噪、图像聚类等方面取得了许多研究成果,具有重要的实用价值。然而,传统的稀疏编码是基于数据的向量表示,即在处理高维多通道图像时,首先将图像其转换成更高维的向量,不仅增加了计算的复杂度,而且破坏了图像像素间的临近信息,甚至破坏了图像中的物体结构特征。
文献“Multi-Dimensional Tensor Sparse Representation(Na Qi,Yunhui Shi,Xiaoyan Sun,Baocai Yin,TenSR,CVPR2016)”公开一种基于Tucker分解的张量稀疏编码模型,如图2所示,该模型分别模拟各个维度的结构特性,缺乏对两个维度之间相关性的考虑,而图像的两个空间维度共同作用才形成了图像中的物体,如果单独考虑其中的某一个维度,都不能很精确的对物体进行描述。虽然基于Tucker分解的张量稀疏能够保留高阶样本的空间结构特性,但该模型存在以下不足:(a)没有考虑各个维度之间的相关性,以图像为例,其两个空间维度之间相互关联;(b)该模型在字典学习的过程中采用了对各个维度的字典逐个更新,算法的可并行能力差,收敛速度慢,极大的限制了该模型在高阶数据中的应用。
文献“High Order Tensor Formulation for Convolutional Sparse Coding(Adel Bibi,Bernard Ghanem,ICCV2017)”公开一种两阶的卷积稀疏编码,其中字典的每一项可以看作是一个滤波器,如图3所示,将原有的卷积稀疏编码模型推广到任意维度的高阶数据运算中。该技术从滤波器的角度出发,字典中的每一项表示一个高阶滤波器。该技术的主要缺点在于计算的复杂度高,限制了高阶滤波器的应用范围,具体表现在:在求解稀疏表示和字典学习时都需要求解线性系统,需要矩阵的逆运算,计算的复杂度较高,很难推广到大规模的高阶数据运算中。
文献“Denoising and Completion of 3D Data via MultidimensionalDictionary Learning(Zemin Zhang,Shuchin Aeron,IJCAI2016)”提出了一种三阶的基于张量线性组合的张量稀疏编码模型,该技术采用了张量线性组合来近似三阶的张量,该技术并没有深入挖掘张量线性组合和传统的线性组合之间的差异,且该技术只适用于三阶张量,不能明显的推广到高阶(大于三阶)张量。同时该技术在更新字典时采用了逐个更新字典的基,并行性差。在每个基的更新过程中都需要做SVD分解,复杂度高,很难推广到大规模的高阶应用中。
传统的基于向量的稀疏编码模型在处理高维数据时,通常是将高维数据转化成一维的向量,这样做的局限性主要在与:(a)向量化的过程会丢失很多的空间结构信息,如图1所示,向量化之后,图片中的飞机结构将完全丢失;(b)高维数据的向量化过程会产生维度很高的向量,如100×100大小的图片,向量化之后的维度为10000,给运算带了非常大的负担,限制了稀疏编码在高维数据中的应用。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711403739.7/2.html,转载请声明来源钻瓜专利网。