[发明专利]一种实现迭代重构图像的方法及系统有效
申请号: | 201110050568.0 | 申请日: | 2011-03-02 |
公开(公告)号: | CN102163319A | 公开(公告)日: | 2011-08-24 |
发明(设计)人: | 张广勇;沈铂;卢晓伟;赵开勇;谢海波 | 申请(专利权)人: | 浪潮(北京)电子信息产业有限公司 |
主分类号: | G06T1/20 | 分类号: | G06T1/20;G06T5/50 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 栗若木;王漪 |
地址: | 100085 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 实现 迭代重 构图 方法 系统 | ||
技术领域
本专利涉及图形图像处理技术,尤其涉及采用迭代法实现图像重构的方法及系统。
背景技术
图像重构无论是在医学诊断,还是在生物样品的成像,以及在地表层析成像等诸多领域中都有着广泛的应用。迭代重构图像方法是20世纪70年代初发表的一种图像重构方法,它可以重构出较清晰的图像,并且其应用正在逐步扩展。迭代法可以表述成:Ax=p,其中A为非奇异矩阵,x为未知数向量,p为已知向量,迭代法求解目标在于确定x的数值。在迭代重构图像方法中,A为加权因子,p为投影得到的图像像素值,x则为需要重构的图像的像素值。
图1说明了采用迭代重构图像方法实现图像重构的过程。该方法通过赋0值或随机值或背投影方法获取用于迭代过程中的初值X(0),然后经过多次的重投影和背投影的迭代过程,来求得最后满足精度要求的重构图像的像素值。
自从2006年英伟达(NVIDIA)公司推出图形处理器G80(包含了128个流式多处理器,最新的G200包含了240个多处理器)以来,图形处理器(GPU,Graphic Processing Unit)在某些大规模并行计算的应用上,相对于CPU来说性能提高可达100倍以上。尤其从2008年5月,NVIDIA公司推出用于GPU的开发平台统一计算设备架构(CUDA,Compute Unified DeviceArchitecture)软件开发工具包(SDK,Software Development Kit)1.1以来,基于GPU平台的并行计算便得到了大规模的推广。CUDA为GPU计算提供了统一计算设备架构,使用户很容易地将GPU编程融于传统的编程工具(例如Visual Studio、Gcc等)和语言(例如C、C++及FORTRAN等)中。在短短的一年以来,CUDA被应用于加速大规模并行计算领域的许多方面,如在图像处理,物理模型模拟(如计算流体力学),工程和金融模拟与分析,生物医药工程,数据库及数据挖掘,搜索,排序等诸多方面都有很好的应用,在很多应用中取得了1至2个几何数量级的加速。
GPU拥有更多的晶体管,用于数据处理而不是像CPU那样去处理数据cache和指令控制,这意味着GPU具有巨大的并行计算能力。在GPU中,单一的数据处理单元为流处理器(SP),8个SP组成一个流处理器组(SM),一个GPU具有多个SM,每个SM除了有8个SP,还有一些高速缓存器(caches,包括纹理存储器、常量存储器及共享存储器)和两个特殊功能单元(SFU)。片外全局存储器(即显卡上的显存)用来存储数据并实现CPU和GPU之间的数据传递。
CUDA C作为GPU的并行编程语言。CUDA C编程将CPU称之为主机,将GPU作为一个协处理器称为设备。在CUDA编程中,多个线程同时执行在一个GPU上,并由多个线程组成一个线程块(Block),多个线程块又组织成网格(Grid);另外,每32个线程组成一个束(warp)。CUDA编程中常用到的优化技术有合理的网格配置,每个SM上有足够多的warp可隐藏访问延迟,并进行全局存储器的合并访问,共享存储器的使用,纹理存储器和常量存储器的使用,寄存器的合理使用等等。
迭代重构算法在所有图像重构算法中重构效果较好,但其运算量巨大,因此需要提高运算效率,来满足快速图像重构的需求。可见,目前需要针对基于GPU平台设计一种迭代重构图像的方法,通过GPU高效快速的计算特性,能够极大地加速迭代重构方法的执行,从而快速地完成图像重构任务。
发明内容
本发明所要解决的技术问题是提供一种实现迭代重构图像的系统及方法,能够基于GPU平台实现快速迭代重构图像。
为了解决上述技术问题,本发明提供了一种实现迭代重构图像的方法,涉及CPU的主机端,其特征在于,还涉及图像处理器GPU的设备端,该方法包括:
主机端将要进行迭代重构图像中的物体分成切片,根据切片上的元素数设置并行执行迭代重构图像的线程数;
设备端根据线程数使用相应的多线程并行地根据切片的重构图像值和测量获取的该切片投影图像值,依次通过重投影算法和背投影算法计算获取切片的重构图像值。
进一步地,主机端将要进行迭代重构图像中的物体分成切片,根据切片上的元素数设置并行执行迭代重构图像的线程数,具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮(北京)电子信息产业有限公司,未经浪潮(北京)电子信息产业有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110050568.0/2.html,转载请声明来源钻瓜专利网。