[发明专利]一种运行于多核计算机平台的并行通用序列的比对方法在审
申请号: | 201410491798.4 | 申请日: | 2014-09-24 |
公开(公告)号: | CN104239732A | 公开(公告)日: | 2014-12-24 |
发明(设计)人: | 李肯立;朱香元;唐卓;徐雨明;李克勤;肖正 | 申请(专利权)人: | 湖南大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 长沙市融智专利事务所 43114 | 代理人: | 黄美成 |
地址: | 410082 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种运行于多核计算机平台的并行通用序列的比对方法,首先利用聚类方法(Cluster)对待比对序列集进行分类,得到大小不等的子序列集合(C1,C2,……,Cm)。然后,应用分配方法(Distribute)将待比对的子序列集合分配到各计算核上(Core1,Core2,……,Coren),以各个核上的负载平衡为分配的最终目标。接着,应用现有的序列比对方法对各子序列集合分别进行比对(Align)。最后,应用合并方法(Merge),将已比对的子序列集合合并,得到待比对序列集的最终比对结果。本发明基于多核计算平台,充分利用了数据并行的计算策略,从而显著提高生物序列比对的处理效率。 | ||
搜索关键词: | 一种 运行 多核 计算机 平台 并行 通用 序列 方法 | ||
【主权项】:
一种运行于多核计算机平台的并行通用序列的比对方法,其特征在于,首先应用聚类方法对待比对序列集合以已知功能序列作为聚类中心进行划分得到多个序列子集;然后将多个序列子集分配到各计算机核上独立地与各自的聚类中心进行比对,得到序列子集的比对结果;最后应用渐进式方法对序列子集的比对结果进行合并,得到待比对序列集合的比对结果矩阵A,完成序列比对;所述矩阵A满足以下条件:(1)矩阵A中的元素aij,aij∈Σ∪{·};其中,Σ表示生物序列字母表,若为DNA序列,则Σ={A、C、G、T};若为蛋白质序列,则Σ为20个简单氨基酸分子;{·}表示在序列比对过程中插入的空格;(2)若删除空格,矩阵A中的行ai=ai1ai2…ail(1≤i≤n)即为待比对序列集合中的某一序列;(3)矩阵A中不存在全为空格的列。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410491798.4/,转载请声明来源钻瓜专利网。
- 上一篇:一种治疗咽喉疾病的喉钳
- 下一篇:一种肿瘤提取器
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用