[发明专利]一种用于宏基因组测序数据的微生物物种与功能组成分析方法在审
| 申请号: | 202011592565.5 | 申请日: | 2020-12-29 |
| 公开(公告)号: | CN112599198A | 公开(公告)日: | 2021-04-02 |
| 发明(设计)人: | 李鸿毅;曲昊淼;寇文伯;薛正晟;孙子奎 | 申请(专利权)人: | 上海派森诺生物科技股份有限公司 |
| 主分类号: | G16B30/00 | 分类号: | G16B30/00;G16B50/00 |
| 代理公司: | 上海点威知识产权代理有限公司 31326 | 代理人: | 胡志强 |
| 地址: | 200030 上海市*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 用于 宏基 序数 微生物 物种 功能 组成 分析 方法 | ||
本发明公开了一种用于宏基因组测序数据的微生物物种与功能组成分析方法,包括下列步骤:1)切除原始数据中的接头序列片段、低质量片段,滤除过短序列、含模糊碱基序列;2)使用上述获得的数据进行物种注释,3)对剔除非目物种后的序列进行拼接,4)对叠连群序列进行相似性聚类,5)使用blastn算法,6)预测非冗余的叠连群序列中的基因区域,7)将非冗余蛋白序列集与各类蛋白注释数据库进行比对,8)计算基因序列丰度,本发明满足了拼接产生的叠连群序列的进一步分析,避免了结果假阳性高,依赖于专用数据库的构建,适用面窄的问题;灵敏度高,提高了准确性。
技术领域
本发明涉及微生物基因分析领域,尤其涉及一种用于宏基因组测序数据的微生物物种与功能组成分析方法。
背景技术
随着下一代高通量测序技术(Next Generation Sequencing,NGS)的不断发展,人们对于微生物群落方面的研究也越来越全面和深入。区别于常见的靶向微生物核糖体RNA基因的扩增子测序技术,宏基因组学是将整个群落系统中全体微生物的基因组作为研究对象,基于鸟枪法测序技术,全面展现整个群落的物种组成和功能潜能组成,进而阐明微生物群落的作用机制。然而,由于测序样本类型的多样,样本量规模、测序深度的多变,以及宿主、污染基因组的多少等因素,以及分析本身的复杂性,研究者们发开出了数量庞大的各类软件,以及配套的更为复杂的各种分析模式、参数和数据库。目前,只有少数几个流程软件或分析网站提供了自动化的宏基因组分析方法或服务。其中,以MG-RAST(https://www.mg-rast.org/)和IMG/M(https://img.jgi.doe.gov/cgi-bin/m/main.cgi)等(宏)基因组数据库网站为代表,它们在提供数据上传和存储服务的同时,也提供了有限种类的分析项目和计算资源。而另一类软件,如HUMAnN2(http://www.huttenhower.org/humann2)以及发明专利“一种宏基因组数据分析方法及系统”(CN 108334750 B)等,则是基于非拼接序列数据的数据库比对注释,也就是说,其物种或基因的鉴定,主要依赖于数据库对目标样本的微生物基因组的覆盖度。然而,对于环境样本,如土壤,底泥,极端环境,我们对于微生物群落的认识是极其有限的,因而此类分析流程,适用的样本类型也是有限,主要以人体相关样本为宜。
这些现有的宏基因组分析流程具有如下缺陷:
(1)未包含拼接步骤,无法满足基于拼接产生的叠连群序列的进一步分析。
(2)物种分类学注释依靠非拼接序列数据的比对分析,未包含序列拼接并基于拼接后的数据进行相应鉴定,因而结果假阳性高,依赖于专用数据库的构建,适用面有限。
(3)对于样本中基因的鉴定,主要采用比对方式,依赖于专用数据库的构建,假阳性高,灵敏度低,适用范围有限。
(4)未包含宿主和/或污染基因组序列去除步骤,或去除步骤依赖于宿主和/或污染基因组的存在。
发明内容
本发明的提供一种用于宏基因组测序数据的微生物物种与功能组成分析方法。
本发明的方案是:
一种用于宏基因组测序数据的微生物物种与功能组成分析方法,包括下列步骤:
1)切除原始数据中的接头序列片段、低质量片段,滤除过短序列、含模糊碱基序列;若已知宿主基因组,则将宿主序列剔除;
2)使用上述获得的数据进行物种注释,并统计物种序列数即为丰度,再基于注释结果剔除注释到非目的物种的序列;
3)对剔除非目物种后的序列进行拼接,获得叠连群序列;
4)对叠连群序列进行相似性聚类,并计算各样本非冗余的叠连群序列丰度,并去掉总丰度为零的序列;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海派森诺生物科技股份有限公司,未经上海派森诺生物科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011592565.5/2.html,转载请声明来源钻瓜专利网。





