[发明专利]一种一键化分析RNA数据的系统在审
申请号: | 201710607777.8 | 申请日: | 2017-07-24 |
公开(公告)号: | CN107451429A | 公开(公告)日: | 2017-12-08 |
发明(设计)人: | 刘旭;成睿;张涌 | 申请(专利权)人: | 西北农林科技大学 |
主分类号: | G06F19/28 | 分类号: | G06F19/28 |
代理公司: | 西安通大专利代理有限责任公司61200 | 代理人: | 范巍 |
地址: | 712100 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 化分 rna 数据 系统 | ||
技术领域
本发明属于转录组分析领域,涉及用算法一键化得出mRNA与lncRNA的差异基因分析结果。
背景技术
近年来,高通量测序的发展促进了生物技术领域与医学领域的不断进步。随着第三代测序技术的成熟,现在测序的成本大大的降低。越来越多的科研人员愿意进行高通量的测序。通过高通量测序能够分析得到两组样本间的基因与转录本的差异,为以后的实验提供方向和对实验做验证。但是现在的分析都是需要多种分析软件的配合,需要涉及的中间输入和操作较多,由于每个软件之间配合紧密,一个输入或操作错误就会影响最后分析结果的准确性和可靠性,而且浪费了大量的时间与精力。另外,分析软件一般都是基于LINUX的,对许多科研人员来,从其分析结果中挖掘有价值的信息需要熟悉LINUX参数设置和操作,并非易事。因此迫切需要一种能够一键化的从头到尾得到最终所需要的有价值的分析数据的RNA数据分析系统。
发明内容
本发明的目的在于提供了一种一键化分析RNA数据的系统。
为了达到上述目的,本发明采用了以下技术方案:
该系统包括系统运行脚本模块,所述系统运行脚本模块包括作图模块、数据挖掘模块以及数据分析模块;
所述数据分析模块用于差异基因分析;
所述数据挖掘模块用于根据差异基因分析结果中的检验参数进行差异基因的显著性筛选;
所述作图模块用于将差异基因分析结果以及显著性筛选结果通过绘图进行显示。
优选的,所述系统运行脚本模块采用shell语言和R语言编写。
优选的,所述数据分析模块包括用于mRNA的差异基因分析子模块和用于lncRNA的差异基因分析子模块;用于mRNA的差异基因分析子模块通过调用相应分析程序对测序数据依次进行基因组比对、转录本组装和基因差异结果分析,得到差异基因分析结果;用于lncRNA的差异基因分析子模块通过调用相应分析程序对测序数据依次进行基因组比对、转录本组装、lncRNA筛选和基因差异结果分析,得到差异基因分析结果。
优选的,所述比对的结果在进行所述组装之前,对该结果中的比对至参考基因组不同染色体上的测序片段按照染色体编号排序。
优选的,所述检验参数选自p值或/和q值。
优选的,所述系统还包括用于生成脚本操作路径的准备模块。
优选的,所述操作路径包括用于存放参考基因组序列文件和基因注释文件的根路径以及位于该路径下的用于存放实验组和对照组的测序数据子路径。
优选的,所述系统运行于LINUX环境。
与现有技术相比,本发明具有以下有益的技术效果:
本发明不需要在分析过程中手动输入或进行操作,只需要第一步把要分析的两组数据以及基因组序列与相应的参考文件分别放到准备阶段生成的对应文件夹内,直接运行就可以得到分析结果。因此,显著的降低了科研人员对高通量数据分析的难度,使科研人员可以利用现有大量的共享数据,更方便的进行分析。与现有的分析软件相比,本发明不仅提供了差异基因分析结果,而且可以做如下进一步处理,例如按照p、q值更一步的对高通量的数据进行筛选,更好的帮助科研人员分析出最后的结果,以及通过对分析结果进行作图,更好的、更直观的表达出数据的深层次的内容。本发明具有快速、准确、方便的优点,而且可以挖掘更为准确、可靠的数据信息。
进一步的,本发明主要采用的是Shell与R语言编写,可以直接在各种版本linux系统上运行。
附图说明
图1为本发明实施例中一键化分析的流程图。
具体实施方式
下面结合附图和实施例对本发明做进一步详细说明。
针对目前分析软件的支持,本实施例提供了一种用于mRNA、lncRNA的差异基因分析的一键化分析系统,其分析过程中间不需要输入任何参数或操作,对于不熟悉LINUX的科研人员来说,也能够很方便的获得差异基因的分析结果。
该系统包括采用Shell语言编写的系统运行脚本模块RSA。其调用的分析软件是通过尝试了大量的分析数据所需要的软件,按照分析速度最快、准确率最高的标准挑选出来的。
安装:该系统安装并运行于LINUX操作环境,系统内除了包含上述RSA以外,还包含准备模块以及所有需要的分析软件程序(Trimmomatic、fastqc、hisat2、samtools、string tie、cuffcompare、PLEK、ballgown),系统运行安装后安装所有需要的分析软件程序,并且自动配置路径(PATH)变量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北农林科技大学,未经西北农林科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710607777.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:钢带传输辅助机构及钢带冲压装置
- 下一篇:一种钢筋弯曲机
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置