[发明专利]一种微生物的检测识别方法和系统在审
申请号: | 201611213197.2 | 申请日: | 2016-12-23 |
公开(公告)号: | CN106650311A | 公开(公告)日: | 2017-05-10 |
发明(设计)人: | 刘恩浩 | 申请(专利权)人: | 基努里(天津)生物科技有限公司 |
主分类号: | G06F19/20 | 分类号: | G06F19/20;G06F19/22;C12Q1/68 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 300384 天津市南开区*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 微生物 检测 识别 方法 系统 | ||
技术领域
本发明属于生物工程领域,尤其涉及一种微生物的检测识别方法和系统。
背景技术
决定生物性状的蛋白质和RNA分子都是以DNA四种碱基的编码序列形式,将信息储存于生物细胞中。这种DNA分子包含了生物体的全套遗传信息。为了从整体角度去了解遗传信息的功能和作用,最重要的一步是将该生物的全套遗传信息测定出来,即知道该生物所有的DNA碱基排列顺序。传统的基因组测序主要采用“sanger”法测序技术,也称作“末端终止法”测序技术。这种测序方法的最大缺点是:成本高、产量低。近年来,以solexa为代表的“新一代高通量测序技术”悄然兴起。以“边合成边测序”为原理的solexa测序技术,有效地改进了传统sanger测序法的不足,具有成本低、通量高、时间短、测序准确率高、操作简便等诸多优点。
微生物在自然界中是无处不在,无处不有的,数目巨大。微生物对于地球上的生命是至关重要的,它们可以将重要的元素转换为能量,保持大气中的化学平衡,为植物和动物提供养分。微生物还可以用于实现许多商业目的,如制造抗生素、提高农业效率以及生产生物燃料。此外还有一小部分微生物对人有害,导致各种疾病的发生。从历史观点来看,微生物研究主要集中于研究个体物种。但大多数微生物是以群落的形式存在于各种环境中(生物内环境、外环境、极端环境等),而无法在实验室里单独培养。对于环境中复杂的微生物群落,传统的研究方法是针对特定的保守基因(如16S rRNA等)使用PCR技术扩增后进行测序。通过对这些保守基因的进化分类分析,从而将环境微生物进行分类。这是从物种、甚至较高的分类级别来对环境微生物进行检测的方法。这种方法可以检测出环境中未知的微生物,并且具有操作简单、技术完备、成本低廉等优点。但是随着微生物研究的不断深入、已公布的微生物基因组数目日益增多,我们发现基于保守基因测序的检测方法存在如下局限性:
1、无法识别痕量的物种。通过PCR扩增测序得到的都是丰度较高物种的基因序列。对于丰度较低的物种,需要大量的Sanger测序才能发现。
2、不能简单地由几个基因来对物种进行检测。通过对现有703种细菌基因组序列的比较分析和对真实环境样品的16S rRNA测序分析后发现:很多近缘物种的16S rRNA基因非常保守,几乎不存在差异,但是在表型上、功能上却差异显著。
3、检测只能在物种或更高的分类级别上,所得到较高级别的分类信息对以后的功能研究没有太大的作用。而即使是同一种细菌,不同菌株之间也会存在很大差异。
发明内容
本发明的目的在于提供一种微生物的检测识别方法和系统,旨在解决现有的环境微生物检测方法难以识别痕量的物种的问题。
本发明是这样实现的,一种环境微生物检测方法,所述方法包括下述步骤:
采用高通量的测序技术对从环境样本中提取的DNA进行测序,得到DNA标签序列;
去除所述DNA标签序列中存在的载体污染;
将去除载体污染后得到的DNA标签序列与已知数据库中的已知序列进行比对,并根据比对结果确定所述DNA标签序列所属的分类。
作为一个实施例,该方法还包括下述步骤:
对已知数据库中的已知序列进行预处理,得到能唯一代表一个物种的DNA序列片段;
计算特有序列中每一位碱基上DNA标签序列的覆盖次数,通过泊松分布拟合得到特有序列的平均测序深度;
计算特有序列中有多少位碱基被DNA标签序列覆盖,从而得到特有序列的覆盖度;
计算整条序列中有多少位碱基被DNA标签序列覆盖,从而得到整条序列的覆盖度;
根据所述特有区域的平均测序深度、特有序列的覆盖度以及整条序列的覆盖度判断出所述特有序列代表的物种被发现的可信度。
本发明的另一目的在于提供一种环境微生物检测系统,所述系统包括:
DNA测序单元,用于采用高通量的测序技术对从环境样本中提取的DNA进行测序,得到DNA标签序列;
载体污染去除单元,用于去除所述DNA标签序列中存在的载体污染;
所属分类确定单元,用于将去除载体污染后得到的DNA标签序列与已知数据库中的已知序列进行比对,并根据比对结果确定所述DNA标签序列所属的分类。
作为一个实施例,该系统还包括:
已知序列预处理单元,用于对已知数据库中的已知序列进行预处理,得到能唯一代表一个物种的DNA序列片段;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于基努里(天津)生物科技有限公司,未经基努里(天津)生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611213197.2/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用