[发明专利]一种基于CPU+MIC异构平台的SIFT并行处理方法有效

专利信息
申请号: 201611081510.1 申请日: 2016-11-30
公开(公告)号: CN106650315B 公开(公告)日: 2020-01-03
发明(设计)人: 董昊;龚湛;张清 申请(专利权)人: 苏州浪潮智能科技有限公司
主分类号: G16B30/00 分类号: G16B30/00
代理公司: 暂无信息 代理人: 暂无信息
地址: 215100 江苏省苏州市吴*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 cpu mic 平台 sift 并行 算法
【说明书】:

发明公开了一种基于CPU+MIC异构平台的SIFT并行处理方法,对SIFT算法中核心模块进行MIC上的加速,利用消息传递机制系统,对当前多序列进行分割,形成多条单蛋白质序列,对每条蛋白质序列进行并行加速处理、在数据库中进行序列比对,挖掘其并行度。本发明实现整个算法效率大幅提升,并解决传统CPU计算方法以及系统应用的性能低下、生产效率低等问题。

技术领域

本发明异构平台的SIFT并行算法的实现技术,尤其涉及一种基于CPU+MIC平台异构计算的并行加速的处理方法。

背景技术

SIFT(Sorting Intolerant From Tolerant)是一种蛋白质点突变预测方法,它利用多重序列比对技术,对存在于蛋白质序列上的点突变进行评价,并能预测点突变对蛋白质的功能造成的影响。是用来预测当氨基酸变化是否会影响蛋白质的功能的工具,应用于在自然界中突变或者是在实验室的人工诱导变异。

SIFT首先通过blast来查找同源序列,然后使用PSI_BLAST选择相近的相关序列,最后计算氨基酸的转换是否影响蛋白质的功能,具体流程,如图1所示。可以看出SIFT算法是由PSIBLAST算法以及其他后续处理算法组成。PSIBLAST是SIFT算法的核心算法,是基于局部序列比对的数据库相似性搜索工具,一种启发式搜索算法,其核心在于:seeding和extending。流程如下所示:

1. 建立查询字串的列表(make lookup table)

a) 按照字长为W(蛋白一般为3)划分查询序列,构建W字长的字串列表,

b) 寻找所有与字串匹配比对分值大于阈值T的邻居字串(根据打分矩阵),将它们也加入查询字串列表中去

2. 在数据库中搜索增强点(Seeding阶段):在数据库中搜索,与查询字串列表中的字串精确匹配的形成一个hit增强点,作为下一步的种子;

3. 扩展种子(Extending阶段):对于种子,根据打分矩阵沿左右两个方向延伸直到分值低于一个阈值S,得到的结果称为HSP;

4. 根据得分矩阵进行回溯,得出比对结果序列。

基本blast算法是不考虑空位插入的,但在生物进化过程中碱基的插入或缺失突变是普遍存在的,因此比对结果中常会出现一些无空位但不连续的区域,若将这些高分分值片段对通过一些相似性较低且有空位的片段连接起来,就能形成一些更长或更有实际意义的比对,因此改进的BLAST算法允许空位的出现,在多个HSP中,找一个最好的得分最高的片段对(MSP),以此基础运行动态规划将一片段向序列的两段延伸,最终产生一个积分较高的最佳比对结果,且有可能空位产生。

改进算法(含空位)流程:

(1)采取 two-hits阶段,即距离小于A而得分大于T的两个相邻hits串联起来形成种子进入下一步;

(2)两步扩展:首先对种子进行不含空位扩展,形成HSP(最初版本的BLAST),之后进行含空位的扩展。

PSI-BLAST(Position Specific Iterative BLAST),位点特异的迭代blast搜索,主要针对蛋白序列,主要搜索与感兴趣蛋白远源相关的蛋白。第一次blast搜索后,结果中最相似的序列重新构建PSSM(位点特异打分矩阵),然后根据此矩阵进行第二次blast搜素,再调整矩阵,搜索,调整矩阵,如此迭代。与blastp程序相比,提高了搜索的灵敏度。(传统的BLAST对打分矩阵依赖大,HSP的计分值都依赖固定的计分矩阵,建立的PSSM使不能被搜索到的远缘蛋白被比对上),PSIBLAST流程图如图2所示。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201611081510.1/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top