[发明专利]一种基于GPU加速提升的小波变换优化方法在审
申请号: | 201711057966.9 | 申请日: | 2017-11-01 |
公开(公告)号: | CN107730436A | 公开(公告)日: | 2018-02-23 |
发明(设计)人: | 孙自龙;林屹 | 申请(专利权)人: | 天津市科迪信息技术有限责任公司 |
主分类号: | G06T1/20 | 分类号: | G06T1/20;G06T9/00;G06F17/14 |
代理公司: | 天津市新天方有限责任专利代理事务所12104 | 代理人: | 赵棕林 |
地址: | 300384 天津市滨海新区华*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 gpu 加速 提升 变换 优化 方法 | ||
(一)技术领域
本发明涉及图像处理并行计算方法领域,特别是涉及一种基于GPU加速提升的小波变换优化方法。
(二)背景技术
图像压缩技术作为实现数据压缩的有效手段一直是热门研究方向,离散小波变换DWT(Discrete Wavelet Transform)凭借其自身良好的局部特性和时频特性成为图像压缩技术的核心变换算法,在图像压缩领域占有比较重要的地位,具有重要的理论研究价值和实际应用意义。但是小波变换算法基于卷积运算,计算复杂度较高、占用内存空间大、访存次数多,且变换过程中的相邻项之间存在依赖关系,导致小波变换算法面对高清大尺寸图像时,处理效率降低,加速压缩比不理想。目前研究热度高的方向是硬件平台加速实现小波变换算法,以求获得更好的加速比。
(三)发明内容
为了克服现有图像处理并行计算方法的不足之处,本发明提供了一种基于GPU加速提升的小波变换优化方法。
本发明的技术方案是这样实现的:
本方案的一种基于GPU加速提升的小波变换优化方法,其特征在于:包括:
第一步,将需要进行小波变换的图像数据沿主机、设备端的路径复制到设备端的主内存1上;
第二步,对第一步中主内存1内的数据进行边界对称延拓,数据进入到共享内存内,然后对数据进行如下处理:
1)预测1:
c1(2n+1)=x(2n+1)+p'[x(2n)+x(2n+2)]
2)更新1:
d1(2n)=x(2n)+u'[c1(2n-1)+c1(2n+1)]
计算后的数据回到主内存1;
第三步,对第二步中最后得到的数据再次进行边界对称延拓,数据进入到共享内存,然后对数据进行如下处理:
1)预测2:
c2(2n+1)=c1(2n+1)+p”[d1(2n)+d1(2n+2)]
2)更新2:
d2(2n)=d1(2n)+u”[c1(2n-1)+c1(2n+1)]
计算后的数据进入到主内存2;
第四步,对第三步中最后得到的数据进行边界对称延拓,数据进入到共享内存,然后进行系数放缩:
1)系数缩放1:
c3(2n+1)=(-K)·c2(2n+1)
2)系数缩放2:
d3(2n)=(1/K)·d2(2n)
处理后的数据进入到主内存2;
第五步,对第四步中最后得到的数据进行数据矩阵转置,处理后的数据进行行列变换是否结束的判定,判定未结束数据回到第二步继续进行处理,行列变换结束的数据进入5层变换处理是否结束的判定,判定未结束的数据返回第二步继续进行处理,判定成功的数据通过设备端、主机的路径回到主机内存中。
其中原始信号为x(n),预测算子p'=h4/h3,p”=r1/s0;更新算子u'=h3/r3,u”=s0/t0,K=1/t0。
假设小波变换算法的低通分解滤波器系数为h0,h1,h2,h3,h4,有r1=h2-h4-h4h1/h3,s0=h1-h3-h3r0/r1,t0=r0-2r1,r0=h0-2h4h1/h3。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津市科迪信息技术有限责任公司,未经天津市科迪信息技术有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711057966.9/2.html,转载请声明来源钻瓜专利网。