[发明专利]基于GPDSP的大点数FFT向量化汇编代码生成方法有效

专利信息
申请号: 201810530711.8 申请日: 2018-05-29
公开(公告)号: CN108776586B 公开(公告)日: 2019-05-24
发明(设计)人: 刘仲;郭阳;鲁建壮;田希;扈啸;陈海燕;孙永节;陈跃跃;刘胜;吴家铸;王丽萍 申请(专利权)人: 中国人民解放军国防科技大学
主分类号: G06F8/30 分类号: G06F8/30
代理公司: 湖南兆弘专利事务所(普通合伙) 43008 代理人: 周长清;胡君
地址: 410073 湖南*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 汇编代码 大点数 框架模板 向量化 构建 核心模块 模块实现 生成模块 自动化 灵活 转换
【说明书】:

发明公开一种基于GPDSP的大点数FFT向量化汇编代码生成方法,步骤包括:S1.构建用于实现不同任务的多个核心模块,各模板包括所需参数的参数列表;S2.构建大点数FFT的框架模板,框架模板中分别使用各模块实现大点数FFT计算;S3.使用预先构建的汇编代码生成模块将框架模板中各核心模块转换为汇编代码,最终生成所需的大点数FFT汇编代码。本发明具有实现原理简单、操作简便、使用灵活、能够实现大点数FFT向量化汇编代码的自动化生成,且生成效率及性能高等优点。

技术领域

本发明涉及GPDSP(General-Purpose Digital Signal Processor,通用计算数字信号处理器)技术领域,尤其涉及一种基于GPDSP的大点数FFT向量化汇编代码生成方法。

背景技术

离散傅里叶变换(Discrete Fourier Transform,DFT)在现代信号处理系统领域里应用广泛,是典型的计算密集和访存密集型应用,例如N点的DFT变换的计算复杂度为 o(N2)。1965 年Cooley 和Turkey 提出一种快速傅立叶变换(Fast Fourier Transform,FFT)计算方法,可显著地减少运算量,计算复杂度由原来的o(N2)降到o(Nlog2N)。

现有的数值软件代码的性能在很大程度上取决于平台的存储层次结构、处理器提供的特殊指令(特别是向量指令)的使用等,而这些往往与处理器的微体系结构特性息息相关,更为重要的问题是,不同的平台之间的特性差异很大,使得最优化的代码会严重依赖于平台。因此一个合理的实现和最好的实现之间的性能差距越来越大,如在Pentium4上实现的离散傅立叶变换代码,GNU科学库和英特尔供应商的IPP库的运行性能差距达一个数量级以上,后者主要是手工编写和调优的汇编代码,而新平台的发布使得手工编写的代码需要重新实现和优化,这仍然需要耗费大量的工作量,复杂度及成本高。

虽然从理论上来说编译器是实现优化性能最理想的解决方案,因为源代码并不需要重新编写,但是编译器的技术进步赶不上硬件的发展速度,即使是简单的计算问题,使用编译器往往只能产生低效率的代码,存在上述问题主要有两个:其一是缺乏可靠的程序优化技术,当前日益复杂的机器也使这一问题进一步恶化,虽然编译器通常可以采用许多不同的方式转换代码段,但是没有能够保证成功的最优化的方法;其二是很多重要的性能改进都是从算法变换中获得,而这超越了当前编译器所能够达到的能力,大量算法变换依赖于算法的信息,而这些信息很难从一个高层次的语言中提取。

GPDSP作为一种异构多核处理器,它包含CPU核单元和DSP核单元,其中CPU核单元主要用于负责包括存储管理、文件控制、进程调度、中断管理任务在内的通用事务管理以及提供对通用操作系统的完整支持;DSP核单元包含若干具有强大计算能力的64位向量处理阵列,用于支持高密集运算任务的解算,DSP核包含标、向量寄存器文件,标量L1D、向量阵列存储、片内共享存储以及外部DDR存储等复杂的多级存储结构。而复杂的体系结构对高效代码的生成带来巨大的挑战,通过编译器产生的库函数汇编代码很难实现各级存储间的高效数据访问和传递,传统的面向Cache结构的分块矩阵乘法方法也不适合GPDSP的非Cache的向量阵列存储访存模式和向量处理阵列并发向量处理的体系结构特征,难以发挥GPDSP向量计算优势。

目前对实时性要求高的应用系统所调用的高性能库函数,通常都是用手工汇编精心优化,如何针对GPDSP复杂的体系结构特征快速生成高效的库函数汇编代码是当前面临的一个巨大挑战,而其中基于GPDSP架构实现大点数FFT向量化汇编代码生成是亟待解决的问题。

发明内容

本发明要解决的技术问题就在于:针对现有技术存在的技术问题,本发明提供一种具有实现原理简单、操作简便、使用灵活、能够实现代码自动化生成,且生成效率及性能高的基于GPDSP的大点数FFT向量化汇编代码生成方法。

为解决上述技术问题,本发明提出的技术方案为:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810530711.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top