[发明专利]基于云平台的生物信息分析系统在审
| 申请号: | 201710598332.8 | 申请日: | 2017-07-21 |
| 公开(公告)号: | CN107239675A | 公开(公告)日: | 2017-10-10 |
| 发明(设计)人: | 郭权;余果;任一;张磊;周勇;张祥林;黄华生 | 申请(专利权)人: | 上海桑格信息技术有限公司 |
| 主分类号: | G06F19/10 | 分类号: | G06F19/10;H04L29/08 |
| 代理公司: | 上海恒锐佳知识产权代理事务所(普通合伙)31286 | 代理人: | 黄海霞 |
| 地址: | 201321 上海市浦*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 平台 生物 信息 分析 系统 | ||
技术领域
本发明涉及一种基于云平台的生物信息分析系统,属于生物信息学分析技术领域。
背景技术
随着测序技术的快速发展,基因研究机构、医学科研机构和公司产生了海量的生物学测序数据。但是众所周知,实验测序得到的原始数据并不能直接提供有价值的科学研究信息或疾病治疗药物的关联信息,需要利用生物信息学分析技术对这些数据进行计算挖掘,从而给出清晰且易于导出结论的结果信息。生物信息学是在生命科学的研究中以计算机为主要研究工具对生物学数据进行存储和计算分析,面对高通量测序所产生的海量数据,越来越多的研究人员或公司基于高性能计算机集群通过安装各种生物信息分析软件来进行计算分析。生物信息分析过程也是很多软件和程序相互关联,通过不同的步骤方法处理数据后得到最终的分析结果,由于生物信息软件层出不断、更新迭代,每个分析程序参数、文件格式、运行方式各异,研究人员不断的要去研究新的软件方法并在计算机或集群上安装部署都变得十分复杂。海量数据的存储、计算和传输共享也是研究者们快速访问和分析数据中的难点。所以设计构建一种自动化扩展性好的生物信息云计算系统十分必要。
发明内容
本发明的目的是解决目前生物信息分析软件品类繁多,分析效率低下,自动扩展性差,大规模数据难于存储共享和多样化软件程序构建部署分析流程复杂的技术问题。
为实现以上发明目的,一方面,本发明提供一种基于云平台的生物信息分析系统,包括云平台客户端、云平台web服务器和云平台计算系统;
所述云平台客户端和所述云平台web服务器之间通过网络收发信息,所述云平台web服务器和所述云平台计算系统之间通过Nginx网页服务器交换数据;
所述云平台web服务器包括生物信息分析请求接口;
所述云平台计算系统包括生物信息分析应用接口、生物信息分析组件、存储服务器、Mysql数据库和Mongo数据库;
所述云平台计算系统还包括若干计算节点,用于对生物信息进行分析计算;
所述生物信息分析请求接口通过所述Nginx网页服务器连接至所述生物信息分析应用接口,所述生物信息分析应用接口的输出端通过工作流进程管理单元连接至所述生物信息分析组件的输入端,所述生物信息分析组件的输出端分别连接至所述存储服务器、Mysql数据库和Mongo数据库;
所述生物信息分析请求接口向所述生物信息分析应用接口发出生物信息分析请求并发送参数;
所述存储服务器用于存储分析结果数据,所述Mysql数据库用于存储分析记录、状态和日志信息,所述Mongo数据库用于存储供所述云平台客户端展示的图表数据。
进一步地,所述生物信息分析组件为即时模式分析组件或提交模式分析组件。
进一步地,所述提交模式分析组件包括工作流进程管理单元、分析模块和文件组件;
所述分析模块包括若干分析工具,各所述分析工具通过对应的工具代理与所述工作流进程管理单元进行通信;
所述工作流进程管理单元用于将不同的分析任务调度给不同的所述分析模块;
所述文件组件用于使分析结果形成通用的生物信息数据格式。
进一步地,所述工作流进程管理单元通过slurm系统进行任务调度。
另一方面,本发明提供一种基于云平台的生物信息分析方法,包括如下步骤:
在客户端输入用于分析的参数并向web服务器发出分析请求消息;
通过Nginx网页服务器接收请求消息后转发至生物信息分析应用接口,解析参数;
判读所述参数为即时计算型还是投递计算型;
若为即时计算型,则直接在专用即时计算服务器上运行生物信息分析工作流;
若为投递计算型,则将参数传递至计算节点服务器上运行生物信息分析工作流;
将生成的结果数据上传到云平台的存储服务器和mongo数据库;
将生物信息分析工作流的运行状态实时存入Mysql数据库;
向web服务器返回分析成功的消息,web服务器从mongo数据库获取结果提供给客户端。
进一步地,所述投递计算型的分析工作流如下:
工作流进程管理单元获取参数后,按照内部预先定义的逻辑关系,将参数传递到生物信息分析组件的各分析模块,触发各分析模块的运行,各分析模块之间通过协程监听互相有依赖关系的分析模块的运行状态,以各分析模块中的各分析工具为最小级别分析组件,将各分析工具通过slurm投递到计算节点开始计算分析,同时不断监听和接收分析的状态。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海桑格信息技术有限公司,未经上海桑格信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710598332.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:远程疾病诊疗系统
- 下一篇:一种路面智能清洁方法及装置
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





