[发明专利]一种基于龙芯3B的FFTW3优化方法有效
申请号: | 201410153672.6 | 申请日: | 2014-04-16 |
公开(公告)号: | CN103902506B | 公开(公告)日: | 2017-02-15 |
发明(设计)人: | 顾乃杰;王小乐;张明;任开新 | 申请(专利权)人: | 中国科学技术大学先进技术研究院 |
主分类号: | G06F17/14 | 分类号: | G06F17/14 |
代理公司: | 安徽省合肥新安专利代理有限责任公司34101 | 代理人: | 何梅生 |
地址: | 230088 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于龙芯3B的FFTW3优化方法,其特征是在计算规模为合数的复数离散傅里叶变换中利用所述向量指令方法和Cooley‑Tukey算法进行优化;在计算实数离散傅里叶变换中利用所述向量指令方法和实部和虚部单独计算处理方法进行优化。本发明能有效提高FFTW3在龙芯3B处理器上的运行性能,从而达到在龙芯3B处理器上FFTW3的高效实现。 | ||
搜索关键词: | 一种 基于 fftw3 优化 方法 | ||
【主权项】:
一种基于龙芯3B的FFTW3优化方法,其特征在于:所述优化方法是利用向量指令方法、Cooley‑Tukey算法以及实部和虚部单独计算处理方法,分别按如下情况对离散傅里叶变换函数进行优化;情况一:在计算规模为合数的复数离散傅里叶变换中利用所述向量指令方法和Cooley‑Tukey算法进行优化;情况二:在计算实数离散傅里叶变换中利用所述向量指令方法和实部和虚部单独计算处理方法进行优化;所述向量指令方法是指使用所定义的128位访存指令和计算指令对所述离散傅里叶变换函数中的输入参数分别进行访存和2点FFT计算:所述128位访存指令定义为:读取指令VLDC1 vd,addr,用于读取寻址地址寄存器addr中的128位数据到向量寄存器vd中;存放指令VLSC1 vd,addr,用于将寄存器vd中低128位数据存放到地址寄存器addr中;所述计算指令定义为:低128位2点FFT计算指令对VMULADD vd,vs,vt,vr和VMULADDL vd,vs,vt,vr,用于共同完成向量双精度FFT运算低128位数据计算;高128位2点FFT计算指令对VMULADDH vd,vs,vt,vr和VMULADDLH vd,vs,vt,vr,用于共同完成向量双精度FFT运算高128位数据计算;所述Cooley‑Tukey算法是按如下步骤进行:步骤1:利用式(1)和式(2)对所述离散傅里叶变换函数中计算规模N进行索引变换:n=N2×n1+n2 式(1)K=k1+N1×k2 式(2)式(1)和式(2)中,N1和N2为所述计算规模N的因子,且满足N1×N2=N;参数n的值域为[0,N‑1],参数K的值域为[0,N‑1],参数n1和参数k1的值域都为[0,N1‑1],参数n2和参数k2的值域都为[0,N2‑1];步骤2:利用式(3)进行离散傅里叶变换获得离散傅里叶变换的输出值X(k1+N1k2):式(3)中,为所述计算规模N的第n2k1个旋转因子;为所述因子N2的第n2k2个旋转因子;为所述因子N1的第n1k1个旋转因子;由此,将所述计算规模为N的离散傅里叶变换优化成规模为因子N1和因子N2的离散傅里叶变换;所述实部和虚部单独计算处理方法按如下步骤进行:步骤a:判断所述离散傅里叶变换中的计算规模N的奇偶性,若计算规模N为偶数,则执行步骤b后结束;若计算规模N为奇数,则跳转到步骤c,执行步骤c后结束;步骤b:利用式(4)、式(5)和式(6)获得所述离散傅里叶变换在偶数点时输出序列的实部Xreal(k):利用式(7)获得所述离散傅里叶变换在偶数点时输出序列的虚部Ximage(k):式(4)、式(5)、式(6)和式(7)中,x(0),x(1),…x(n)为离散傅里叶变换序列;Xreal(0)为所述输出序列第1个位置的实部值,Xreal(k)表示所述输出序列第k个位置的实部值,参数k的值域为为所述输出序列第个位置的实部值;Ximage(k)为所述输出序列第个k位置的虚部值,参数i的值域为表示计算规模N的第ik个旋转因子;步骤c:利用式(8)和式(9)获得所述离散傅里叶变换在奇数点时输出序列的实部Xreal(k):利用式(10)获得所述离散傅里叶变换在奇数点时输出序列的虚部Ximage(k):式(8)、式(9)和式(10)中,Xreal(0)为所述输出序列第1个位置的实部值,Xreal(k)为所述 输出序列第k个位置的实部值,参数k的值域为为所述输出序列第个位置的实部值;Ximage(k)为所述输出序列第个k位置的虚部值,参数i的值域为表示计算规模N的第ik个旋转因子。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学先进技术研究院,未经中国科学技术大学先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410153672.6/,转载请声明来源钻瓜专利网。
- 上一篇:桡动脉穿刺支撑垫
- 下一篇:一种无线数据移动查房车