[发明专利]一种基于FPGA的Smith-Waterman算法实现方法及装置在审
| 申请号: | 201910676632.2 | 申请日: | 2019-07-25 |
| 公开(公告)号: | CN110473593A | 公开(公告)日: | 2019-11-19 |
| 发明(设计)人: | 邓建晖;周智;薛晖耀;潘焕燕 | 申请(专利权)人: | 深圳大学 |
| 主分类号: | G16B20/30 | 分类号: | G16B20/30;G16B30/10;G16B50/30 |
| 代理公司: | 44205 广州嘉权专利商标事务所有限公司 | 代理人: | 黄广龙<国际申请>=<国际公布>=<进入 |
| 地址: | 518060 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 候选序列 基因序列 匹配 回溯 流水线形式 并行 集合 算法实现 记录 算法 输出 消耗 | ||
本发明公开了一种基于FPGA的Smith‑Waterman算法实现方法及装置,包括:将待匹配基因序列输入PE阵列的集合中,将候选序列以流水线形式输入到对应的PE阵列,PE阵列执行相似性评分;记录PE阵列输出的评分值中最大的值和对应的候选序列;执行回溯以修改待匹配基因序列。装置用于执行方法。本发明通过将待匹配基因序列输入PE阵列的集合中,将候选序列以流水线形式输入到对应的PE阵列,PE阵列执行相似性评分;记录评分值中最大的值和候选序列;能够通过并行的方式执行评分流程。执行回溯以修改待匹配基因序列能够通过执行回溯流程。基于FPGA的PE阵列,能够通过并行的方式执行Smith‑Waterman算法,相对于CPU、GPU方式,消耗更低,性价比高。
技术领域
本发明涉及基因技术领域,尤其是一种基于FPGA的Smith-Waterman算法实现方法及装置。
背景技术
随着生物学的发展,基因测序的作用也越来越大。降低成本和提高速度也就成为了研究的重要方向。在基因测序上用于局部比对的算法主要是Blast和Smith-Waterman。Blast算法是一种在局部比对上近似比对的算法,虽然可以减少程序运行的时间但是准确率不够高。Smith Waterman是一种精确局部比对算法,但是相对复杂,需要提高比对速度。
目前,Smith-Waterman算法已经在CPU、GPU、FPGA上实现过加速。在CPU上实现加速需要高性能的CPU,费用高、速度也不够理想。利用高性能GPU的高度并行性实现加速,运行速度比CPU快了不少,但价格昂贵。FPGA本身就十分适合做并行运算,价格也合理,所以使用FPGA作为硬件加速平台是一种更具性价比的选择。
使用FPGA作为Smith-Waterman加速平台时,采用流水线的方式进行序列比对,使序列对并行工作,从而加快了计算得分矩阵的速度。当基因数据较大时,由于片上资源的限制,无法保存计算得分的路径,从而不能在FPGA上进行回溯,只能采用FPGA+CPU的方式实现加速,在FPGA上进行矩阵得分计算,在CPU上进行回溯。此时,实际上也增对比的成本。
发明内容
本发明实施例旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明实施例的一个目的是提供一种基于FPGA的Smith-Waterman算法实现方法及装置。
本发明所采用的技术方案是:
第一方面,本发明实施例提供一种基于FPGA的Smith-Waterman算法实现方法,包括:将待匹配基因序列输入PE阵列的集合中,将候选序列的集合以流水线形式输入到对应的PE阵列,PE阵列执行待匹配基因序列与候选序列之间的相似性评分;记录PE阵列输出的评分值中最大的值和对应的候选序列;执行回溯以修改待匹配基因序列。
优选地,包括:筛选全部的待匹配基因序列,得到对应的碱基数量的分布状态和分布期望值;根据分布期望值设置FPGA中,PE阵列的PE块的数量。
优选地,包括:待匹配基因序列的碱基数量不大于分布期望值,对应的PE阵列只执行一次运算;待匹配基因序列的碱基数量大于分布期望值,则以第一次运算的相似性评分作为PE阵列的初始值并再次进行相似性评分的运算。
优选地,所述PE阵列在执行相似性评分的同时,输出回溯路径至指定的嵌入式块RAM。
优选地,所述待匹配基因序列设置有对应的序列ID;当所述PE阵列完成一个待匹配基因序列的相似性评分,回溯模块根据回溯路径修改对应的待匹配基因序列。
第二方面,本发明实施例提供一种基于FPGA的Smith-Waterman算法实现装置,包括:PE处理单元,用于将待匹配基因序列输入PE阵列的集合中,将候选序列的集合以流水线形式输入到对应的PE阵列,PE阵列执行待匹配基因序列与候选序列之间的相似性评分;序列存储单元,用于记录PE阵列输出的评分值中最大的值和对应的候选序列;回溯单元,用于执行回溯以修改待匹配基因序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳大学,未经深圳大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910676632.2/2.html,转载请声明来源钻瓜专利网。





