[发明专利]基于CPU+GPU异构的高并发序列比对计算加速方法有效
申请号: | 202210046617.1 | 申请日: | 2022-01-17 |
公开(公告)号: | CN114064551B | 公开(公告)日: | 2022-05-17 |
发明(设计)人: | 张巍;林超宁;张崇 | 申请(专利权)人: | 广州嘉检医学检测有限公司 |
主分类号: | G06F15/16 | 分类号: | G06F15/16;G06F9/48 |
代理公司: | 广州君策达知识产权代理事务所(普通合伙) 44749 | 代理人: | 陈宏升 |
地址: | 510000 广东省广州市黄埔区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 cpu gpu 并发 序列 计算 加速 方法 | ||
本发明公开了基于CPU+GPU异构的高并发序列比对计算加速方法,包含以下步骤:BWA‑MEM算法代码重构;CPU上任务并发处理:完成序列集的划分,第一次形成多个并发任务;运行代码重构后的BWA‑MEM算法,完成GPU上数据并发处理;GPU上任务并发处理:对于序列数据对比过程中产生的种子集和链,将相同或相邻的长度、位置、数量的种子集划分为同一数据块,链做同样处理,由此完成种子集与链的划分,第二次形成多个并发任务。本发明通过设计任务并行+数据并行的方式,让BWA‑MEM算法的特征与GPU加速设备的特征紧密结合,充分利用GPU强大的并发运算能力,为序列比对算法提供优异的性能,对比高并发处理效率较高。
技术领域
本发明涉及生物序列比对领域,特别涉及基于CPU+GPU异构的高并发序列比对计算加速方法。
背景技术
生物序列比对是计算机领域经典的文本比对问题在生物领域的应用。随着不断涌现的新型分子生物学技术的发展 ,随之而来的比如基因变异、RNA表达、蛋白质和基因相互作用等分子生物学研究需要研究人员采用高通量的方法去解释。这对高性能计算提出了新的挑战。高通量测序时代的挑战不再是数据的产生,而是数据存储,处理和分析。第三代测序技术的发展将进一步加快测序速度,同时产生较长的测序片段,对序列比对技术的发展提出了更高的要求。与此同时,计算机硬件平台也在近几年飞速发展, 不断推陈出新,新的多核平台和众核平台不断出现,众核处理器加速设备如GPU使高性能计算机的性能快速提高,GPU异构平台正成为构建高性能计算机的重要方式。这也使得计算机体系结构变得越来越复杂,给计算程序的优化带来了新的难题。
同时,在生物序列比对领域中,采用CPU+GPU异构平台的方式对算法进行加速时一个常见的处理方式。
比如,文献《基于GPGPU的生物序列快速比对》(第一作者马海晨,发表于期刊《计算机工程》第38卷第4期,2012年2月),是在CPU-GPU 异构平台下,提出一种高效的生物序列比对方案。该方案利用GPU的并行处理能力,通过对读延迟、写延迟、重组函数及数据传输进行优化,在OpenCL 框架下重构Smith- Waterman 算法,加快生物序列比对速度。即该文献主要是对SW算法(即Smith- Waterman 算法)进行优化。
再比如,工程硕士论文《生物序列分析算法的CPU_GPU异构并行优化关键技术研究》(作者万文,国防科学技术大学研究生院,2012年3月),其核心思想同样是基于CPU和GPU构建的异构系统,主要是对SW算法(即Smith-Waterman算法)进行优化。
上述技术方案,都是对某个具体算法(例如SW算法、FM-index算法)进行优化或者改进,这些技术方案均是聚焦于算法本身,利用GPU的特性,来解决数据并行的问题,通过对所采用具体算法的改进,来达到生物序列比对速度提升的目的,其缺点在于:在进行生物序列比对时,要先找到一段比较精确的匹配子段作为seed,对于不同的reads,其包含的SMEM长度、位置、数量都有很大的不同;当在GPU平台用采用每个线程处理一个reads的任务划分方式时,这会造成不同线程之间严重的不同步,包含较短SMEM的reads需要等待包含较长SMEM的reads查找完毕, 而对于包含较短SMEM的reads,其包含的SMEM的个数又更多,这样包含较长SMEM的reads又反过来需要等待包含较短SMEM的reads,这种互相等待的情况导致计算资源利用率极低,加速效果非常有限。上述技术方案聚焦于数据并行的问题(进一步加大数据并行的能力),并不能克服所述缺点。
同样,由于BWA-MEM的这种与输入数据高度相关的seeding方式,每个reads包含的seed数量、长度都会有很大不同,这又会影响下一个模块中根据seed生成chain的过程,导致生成chain的模块的不同线程同步性很差,进一步限制了加速效果。由于算法的运行特征与输入数据高度相关,这些方法无法同时适合不同特征的输入数据。 GPU平台对于同一warp内指令一致性的要求使BWA-MEM算法的加速效果受到了严重限制。因此,对于原有的BWA-MEM算法同样不能解决上述问题。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州嘉检医学检测有限公司,未经广州嘉检医学检测有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210046617.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种宽带细步进频率合成电路及方法
- 下一篇:一种双面胶粘性力测试装置