[发明专利]基于云平台的生物信息分析系统在审

专利信息
申请号: 201710598332.8 申请日: 2017-07-21
公开(公告)号: CN107239675A 公开(公告)日: 2017-10-10
发明(设计)人: 郭权;余果;任一;张磊;周勇;张祥林;黄华生 申请(专利权)人: 上海桑格信息技术有限公司
主分类号: G06F19/10 分类号: G06F19/10;H04L29/08
代理公司: 上海恒锐佳知识产权代理事务所(普通合伙)31286 代理人: 黄海霞
地址: 201321 上海市浦*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 平台 生物 信息 分析 系统
【说明书】:

技术领域

发明涉及一种基于云平台的生物信息分析系统,属于生物信息学分析技术领域。

背景技术

随着测序技术的快速发展,基因研究机构、医学科研机构和公司产生了海量的生物学测序数据。但是众所周知,实验测序得到的原始数据并不能直接提供有价值的科学研究信息或疾病治疗药物的关联信息,需要利用生物信息学分析技术对这些数据进行计算挖掘,从而给出清晰且易于导出结论的结果信息。生物信息学是在生命科学的研究中以计算机为主要研究工具对生物学数据进行存储和计算分析,面对高通量测序所产生的海量数据,越来越多的研究人员或公司基于高性能计算机集群通过安装各种生物信息分析软件来进行计算分析。生物信息分析过程也是很多软件和程序相互关联,通过不同的步骤方法处理数据后得到最终的分析结果,由于生物信息软件层出不断、更新迭代,每个分析程序参数、文件格式、运行方式各异,研究人员不断的要去研究新的软件方法并在计算机或集群上安装部署都变得十分复杂。海量数据的存储、计算和传输共享也是研究者们快速访问和分析数据中的难点。所以设计构建一种自动化扩展性好的生物信息云计算系统十分必要。

发明内容

本发明的目的是解决目前生物信息分析软件品类繁多,分析效率低下,自动扩展性差,大规模数据难于存储共享和多样化软件程序构建部署分析流程复杂的技术问题。

为实现以上发明目的,一方面,本发明提供一种基于云平台的生物信息分析系统,包括云平台客户端、云平台web服务器和云平台计算系统;

所述云平台客户端和所述云平台web服务器之间通过网络收发信息,所述云平台web服务器和所述云平台计算系统之间通过Nginx网页服务器交换数据;

所述云平台web服务器包括生物信息分析请求接口;

所述云平台计算系统包括生物信息分析应用接口、生物信息分析组件、存储服务器、Mysql数据库和Mongo数据库;

所述云平台计算系统还包括若干计算节点,用于对生物信息进行分析计算;

所述生物信息分析请求接口通过所述Nginx网页服务器连接至所述生物信息分析应用接口,所述生物信息分析应用接口的输出端通过工作流进程管理单元连接至所述生物信息分析组件的输入端,所述生物信息分析组件的输出端分别连接至所述存储服务器、Mysql数据库和Mongo数据库;

所述生物信息分析请求接口向所述生物信息分析应用接口发出生物信息分析请求并发送参数;

所述存储服务器用于存储分析结果数据,所述Mysql数据库用于存储分析记录、状态和日志信息,所述Mongo数据库用于存储供所述云平台客户端展示的图表数据。

进一步地,所述生物信息分析组件为即时模式分析组件或提交模式分析组件。

进一步地,所述提交模式分析组件包括工作流进程管理单元、分析模块和文件组件;

所述分析模块包括若干分析工具,各所述分析工具通过对应的工具代理与所述工作流进程管理单元进行通信;

所述工作流进程管理单元用于将不同的分析任务调度给不同的所述分析模块;

所述文件组件用于使分析结果形成通用的生物信息数据格式。

进一步地,所述工作流进程管理单元通过slurm系统进行任务调度。

另一方面,本发明提供一种基于云平台的生物信息分析方法,包括如下步骤:

在客户端输入用于分析的参数并向web服务器发出分析请求消息;

通过Nginx网页服务器接收请求消息后转发至生物信息分析应用接口,解析参数;

判读所述参数为即时计算型还是投递计算型;

若为即时计算型,则直接在专用即时计算服务器上运行生物信息分析工作流;

若为投递计算型,则将参数传递至计算节点服务器上运行生物信息分析工作流;

将生成的结果数据上传到云平台的存储服务器和mongo数据库;

将生物信息分析工作流的运行状态实时存入Mysql数据库;

向web服务器返回分析成功的消息,web服务器从mongo数据库获取结果提供给客户端。

进一步地,所述投递计算型的分析工作流如下:

工作流进程管理单元获取参数后,按照内部预先定义的逻辑关系,将参数传递到生物信息分析组件的各分析模块,触发各分析模块的运行,各分析模块之间通过协程监听互相有依赖关系的分析模块的运行状态,以各分析模块中的各分析工具为最小级别分析组件,将各分析工具通过slurm投递到计算节点开始计算分析,同时不断监听和接收分析的状态。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海桑格信息技术有限公司,未经上海桑格信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710598332.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top