[发明专利]一种基因测序方法和装置在审
申请号: | 202110353942.8 | 申请日: | 2021-04-01 |
公开(公告)号: | CN112992270A | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 崔坤磊 | 申请(专利权)人: | 山东英信计算机技术有限公司 |
主分类号: | G16B30/00 | 分类号: | G16B30/00;G16B50/30 |
代理公司: | 北京连和连知识产权代理有限公司 11278 | 代理人: | 刘小峰;陈黎明 |
地址: | 250101 山东省济南市高新区*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基因 方法 装置 | ||
本发明公开了一种基因测序方法和装置,方法包括:基于参数文件创建项目目录树并生成具有多个分析任务作业的作业流;在作业流中依次调用每个分析任务来处理基因测序数据;响应于有分析任务在处理基因测序数据时请求调用应用软件,而从应用软件平台调用应用软件;响应于有分析任务或应用软件在处理基因测序数据时请求调用测序参考数据,而从数据库系统调用测序参考数据;响应于有分析任务完成并输出临时结果,而将临时结果输入作业流中的下一个分析任务以继续处理基因测序数据直到获得基因测序结果。本发明能够高效地执行基因测序流程,并兼容断点处理,降低中断成本。
技术领域
本发明涉及基因测序领域,更具体地,特别是指一种基因测序方法和装置。
背景技术
新一代测序的发展和推广应用使生物序列数据增长速度远远超过了摩尔定律对计算机处理能力增长的预期。研究人员将深入分析各种基因组数据的特点,针对性地研究高效数据压缩和传输的方法,研究新型的数据存储系统构架;研究在压缩空间上进行数据处理的方法,将存储、压缩和处理、应用结合起来考虑,发展适应超大规模基因组数据的搜索方法;深入分析测序数据的特点和测序数据常见处理任务对计算资源的需求特点,探索新的软硬件模型和可能的新型体系结构,探索新的计算服务模型在测序数据存储、传输和处理上的应用,从计算技术上为迎接个体基因时代的到来做好充分准备。
至今,受益于软件技术的繁荣创新,生物信息学数据的处理已经形成了系统化、流程化的数据处理方法。所谓流程,即针对测序下机数据的一系列处理作业,且这些作业是存在先后顺序和依赖关系的,上一个作业的输出结果为下一个作业的输入数据,各作业由不同应用软件完成。因此,如何高效地执行创建流程、高效执行流程中的作业,避免作业之间的衔接的时间和资源浪费,就成为测序数据处理流程中必须要考虑的问题。同时,当流程中有作业出错时,还必须能够快速定位出错的作业,并从该出错作业开始断点执行流程。
针对现有技术中测序数据处理流程缺乏高效的创建和执行、难以定位错误并断点执行的问题,目前尚无有效的解决方案。
发明内容
有鉴于此,本发明实施例的目的在于提出一种基因测序方法和装置,能够高效地执行基因测序流程,并兼容断点处理,降低中断成本。
基于上述目的,本发明实施例的第一方面提供了一种基因测序方法,包括执行以下步骤:
基于参数文件创建项目目录树并在项目目录树中生成具有多个分析任务作业的作业流;
获取基因测序数据,并基于参数文件在作业流中依次调用每个分析任务来处理基因测序数据;
响应于有分析任务在处理基因测序数据时请求调用应用软件,而允许分析任务基于参数文件从应用软件平台调用应用软件以处理基因测序数据;
响应于有分析任务或应用软件在处理基因测序数据时请求调用测序参考数据,而允许分析任务或应用软件基于参数文件从数据库系统调用测序参考数据以处理基因测序数据;
响应于有分析任务完成并输出临时结果,而将临时结果输入作业流中的下一个分析任务以继续处理基因测序数据直到获得基因测序结果。
在一些实施方式中,方法还包括:
响应于有分析任务在处理基因测序数据时发生中断,而获取在中断时生成的任务状态信息和错误信息;
响应于接收到使发生报错中断的作业流继续执行的指示,而基于任务状态信息和错误信息在中断位置重新执行分析任务。
在一些实施方式中,参数文件包括工程名、工程类型、和工程主目录;基于参数文件创建项目目录树包括:基于工程名、工程类型、和工程主目录创建项目目录树。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东英信计算机技术有限公司,未经山东英信计算机技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110353942.8/2.html,转载请声明来源钻瓜专利网。