[发明专利]一种基于CUDA异构并行加速的雷达MTI和MTD实现方法有效
申请号: | 202110238579.5 | 申请日: | 2021-03-04 |
公开(公告)号: | CN112986944B | 公开(公告)日: | 2023-09-08 |
发明(设计)人: | 贾宗衡;孙子棠 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G01S7/41 | 分类号: | G01S7/41 |
代理公司: | 北京沃知思真知识产权代理有限公司 11942 | 代理人: | 周俊华 |
地址: | 710000 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 cuda 并行 加速 雷达 mti mtd 实现 方法 | ||
1.一种基于CUDA异构并行加速的雷达MTI和MTD实现方法,其特征在于,包括如下步骤:
步骤1,在CPU中设置雷达信号处理参数值,读取经过脉冲压缩后的Nr×Nc维回波数据矩阵X,将其作为MTI处理前的初始数据并逐一拷贝到开辟好的GPU显存中;
步骤2,使用2维线程索引分配CUDA线程的网格(Grid)和线程块(Block)大小,在GPU中执行二次对消器MTI核函数,输出滤除静物杂波后的回波数据和运动目标所在的距离单元;
步骤3,对步骤2得到的Nr×Nc维结果矩阵XMTI,在GPU中先执行矩阵转置核函数,再执行CUFFT库中的cuFFTExeC2C函数完成多组多普勒通道的FFT并行计算,最后再次执行矩阵转置核函数,得到MTD并行算法输出的Nr×Nc维矩阵XMTD,将其从GPU拷贝回CPU;
步骤4,采用代码指令优化、最佳线程分配、对齐合并全局内存访问等策略,对第2,3步中分别实现的MTI和MTD的核函数进行优化,计算优化后CUDA异构并行算法与CPU串行算法的加速比。
2.根据权利要求1所述的方法,其特征在于,步骤1具体包括以下子步骤:
步骤1.1,在CPU中设置发射信号参数,对脉冲压缩得到的Nr×Nc维回波矩阵X,使用cudaMalloc函数开辟GPU显存空间;
步骤1.2,使用cudaMemcpy函数和cudaMemcpyHostToDevice参数,将每个脉冲压缩后的回波数据从CPU拷贝到GPU,CUDA的每个线程存储当前采样点值和采样点经延迟线之后的值。
3.根据权利要求1所述的方法,其特征在于,步骤2具体包括以下子步骤:
步骤2.1,根据拷贝到GPU上的回波数据长度,划分线程组织的网格(Grid)和线程块(Block)大小,每个GridDim.x维度上的线程负责完成一组三脉冲对消的两次减法运算;
步骤2.2,执行二次对消器MTI核函数,利用线程索引值在GPU中完成一个脉冲重复周期内相同距离分辨单元采样点的两次减法运算。
4.根据权利要求1所述的方法,其特征在于,步骤3具体包括以下子步骤:
步骤3.1,划分线程组织的网格(Grid)和线程块(Block)大小,GridDim.x维度处理多个通道的距离维数据,GridDim.y维度处理多个通道的多普勒维数据;
步骤3.2,针对执行完二次对消MTI核函数后的矩阵数据,配置核函数将每个多普勒通道数据映射到线程块中,在GPU中执行矩阵转置核函数,距离维和多普勒维的数据地址均变为连续;
步骤3.3,创建cuFFT句柄,调用CUDA库函数cufftPlan2D来配置一个2维的cuFFT plan,在多普勒维使用参数为CUFFT_FORWARD的库函数cufftExecC2C执行复数域到复数域的FFT并行算法;
步骤3.4,对FFT并行计算后得到的矩阵再执行一次矩阵转置核函数,得到MTD并行算法输出的Nr×Nc维矩阵XMTD;根据运动目标所处的多普勒通道得到多普勒频移,求解其径向速度和速度分辨率的公式分别为:
其中,c是光速,fc是载频,Δfd是多普勒分辨率,fr是脉冲重复频率,mtdFFT是MTD选用的FFT点数;
步骤3.5,使用cudaMemcpy函数和cudaMemcpyDeviceToHost参数,将MTD处理后的目标回波数据从GPU拷贝回CPU,调用cufftDestroy函数销毁cuFFT句柄,调用free函数和cudaFree函数分别释放CPU和GPU占用的内存资源。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110238579.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:把手焊接设备
- 下一篇:一种基于人工智能的教学系统、计算机设备、存储介质