[发明专利]一种用于16S rRNA基因的细菌群落组成和多样性分析的自动化方法有效
申请号: | 201611187576.9 | 申请日: | 2016-12-20 |
公开(公告)号: | CN106815492B | 公开(公告)日: | 2019-02-12 |
发明(设计)人: | 薛正晟;寇文伯;王慧娟;姜丽荣;孙子奎 | 申请(专利权)人: | 上海派森诺生物科技股份有限公司 |
主分类号: | G16B30/00 | 分类号: | G16B30/00 |
代理公司: | 上海天翔知识产权代理有限公司 31224 | 代理人: | 吕伴 |
地址: | 200231 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 16 srrna 基因 细菌 群落 组成 多样性 分析 自动化 方法 | ||
本发明公开的一种用于16S rRNA基因的细菌群落组成和多样性分析的自动化方法,其提供的16S rRNA测序数据分析流程以测序原始序列数据作为输入,调用业界标准的分析工具(如:Mothur、QIIME等),最终对数据进行可视化,并得到易于解读的分析结果。本发明包含了目前流行的主流分析项目,同时分析内容实现模块化,数据挖掘分析的方法更多样、更深入,可以根据不同的需要结合不同的分析模块内容,先后顺序的流程安排也更合理;此外,消除了测序深度不一导致的分析误差,使分析结果更全面、准确、可靠。
技术领域:
本发明一般有关于分子生物学技术领域,特别涉及高通量测序数据分析技术领域,并且更具体地说,涉及一种用于16S rRNA基因的细菌群落组成和多样性分析的自动化方法。
背景技术:
新一代高通量测序技术大幅度降低了测序的时间和成本,使得大规模测序逐渐成为常规的研究和检测手段,测序产生的数据量急剧增加。如何高效地分析这些数据,已成为迫切需要解决的问题。
目前高通量测序数据分析工具很多,进行分析序列信息的生物信息学工具纷繁复杂,对于分析菌群微生态的大规模测序数据,也已开发产生多种成熟的分析工具可供使用。其中,针对于菌群多样性和组成谱检测这一广泛应用的研究策略,绝大多数基于微生物核糖体RNA(rRNA)基因的序列分析工具并不能一次性满足研究人员的大部分分析需求,往往需要多次调用不同的分析工具(甚至不同的计算机平台系统)以完成所有相关分析。
当前用于rRNA基因序列分析的工具分为两大类:基于Web的工具和本地安装的工具。基于Web的工具托管在服务器上,为用户提供Web界面。例如Ribosomal DatabaseProject(RDP)的分类鉴定工具等;研究人员可以通过互联网上传测得的序列数据,并使用Web界面配置可选参数进行分析。但是对于一次上传的数据量存在限制,并受网络环境所约束,不适合大规模数据分析,并且远程用户无法根据自己的需求来自定义后端分析软件,并不方便。本地化的16S rRNA基因分析工具包括Mothur和QIIME等。使用这些本地工具时,不需要将数据上传到远程服务器,只需在Linux服务器/工作站合理配置安装即能投入使用。这些工具大多是开源形式,允许研究人员根据需要自定义软件。然而,很多情况下,根据不同的分析需求,实现一个完整的分析流程仍需要对众多工具进行整合。如何能正确高效地选择并整合这些工具已成为迫切需求。
现有的16S rRNA基因的细菌群落组成和多样性分析流程中,分析内容较为基础和简单,未包含目前流行的多项主流分析项目:Specaccum物种累积曲线、LEfSe分析、Wilcoxon秩和检验等。在一些情况下,无法满足研究人员的分析需求。此外,原有分析流程在进行后续PCA、PCoA等比较分析时,未对数据进行拉平处理,由此将会引入测序深度不一导致的分析误差。
发明内容
本发明的一个目的是为了克服现有工具中固有的弱点并结合其优势,提供一种用于16S rRNA基因的细菌群落组成和多样性分析的自动化方法,该方法具有可靠的流程,已确保分析结果的准确。并满足多种分析需求。
本发明的另一个目的是为了提供一种16S rRNA测序数据分析流程,实现各个环节的高效自动化管理和分析,从而节省时间成本,减轻研究人员的数据分析负担。
为了实现上述目的,本发明所采用的技术方案如下:
一种用于16S rRNA基因的细菌群落组成和多样性分析的自动化方法,其提供的16S rRNA测序数据分析流程以测序原始序列数据作为输入,调用业界标准的分析工具(如:Mothur、QIIME等),最终对数据进行可视化,并得到易于解读的分析结果,具体包括以下步骤:
1)通过原始序列的测序质量值、模糊碱基数目、序列长度、引物序列和barcode序列的匹配度信息,对原始序列进行过滤和质量控制,并检查和剔除嵌合体,获得高质量序列;
2)对步骤1)获得的高质量序列的长度分布进行统计;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海派森诺生物科技股份有限公司,未经上海派森诺生物科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611187576.9/2.html,转载请声明来源钻瓜专利网。