[发明专利]一种基于纳米孔和高通量测序数据的噬菌体鉴定和宿主预测方法有效
| 申请号: | 202211107292.X | 申请日: | 2022-09-13 |
| 公开(公告)号: | CN115198036B | 公开(公告)日: | 2022-12-30 |
| 发明(设计)人: | 陈勇;陈毅强;涂勇;范亚民;崔韬 | 申请(专利权)人: | 江苏省环境工程技术有限公司 |
| 主分类号: | C12Q1/70 | 分类号: | C12Q1/70;C12Q1/6869;G16B30/10 |
| 代理公司: | 南京知识律师事务所 32207 | 代理人: | 卢亚丽 |
| 地址: | 210019 江苏省南京*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 纳米 通量 序数 噬菌体 鉴定 宿主 预测 方法 | ||
本申请涉及生物信息学领域,公开了一种基于纳米孔和高通量测序数据的噬菌体鉴定和宿主预测方法。通过将原始纳米孔测序数据与高通量测序数据相结合,设计了质控过滤流水线对两套测序数据分别进行质控和过滤,再在混合组装后的序列中根据噬菌体基因的特征模型鉴定出潜在的噬菌体序列,接着提取数据库中原有的细菌基因组所携带的特殊间隔序列,最后通过与数据库中提取的特殊间隔序列进行比对,挖掘对应关系,预测噬菌体对应的宿主关系。本发明实现了对纳米孔和高通量测序数据中噬菌体序列的有效挖掘与噬菌体宿主的有效预测,具有十分重要的推广应用价值。
技术领域
本申请属于生物信息学技术领域,具体涉及一种基于纳米孔和高通量测序数据的噬菌体鉴定和宿主预测方法。
背景技术
噬菌体是一种特异性侵染细菌的病毒,一方面,噬菌体具有重要的生态学意义,噬菌体可以通过裂解细菌,调节细菌的种群数量;另一方面,噬菌体具有重要的潜在应用价值,噬菌体可以通过精准控制病原菌的生长,避免抗生素的大量使用带来的广泛耐药性。在污水处理领域,噬菌体也具有控制不利细菌的应用前景。
现有相关技术中,对于噬菌体鉴定和宿主预测,中国专利申请号CN201910506027.0,申请日为2019年6月12日的专利申请文件公开了一种基于高通量测序数据的溶源性噬菌体预测方法,实现了对细菌基因组中的溶源性噬菌体的有效预测。但是该发明一方面并没有考虑游离噬菌体的鉴定和宿主预测方法,另外一方面并没有涉及纳米孔测序数据的噬菌体分析方法。中国专利申请号CN201911110250.X,申请日为2019年11月14日的专利申请文件公开了一种高通量筛选噬菌体宿主谱的方法,只需1人做2天就能完成噬菌体的宿主鉴定。但是该发明一方面主要依赖传统生物培养,而非高通量测序数据,另外一方面该噬菌体宿主鉴定方法仍然耗时较长。中国专利申请号CN202010241653.4,申请日为2020年3月31日的专利申请文件公开了一种细菌中功能性前噬菌体及其位置与序列的检测方法,能够检测一种细菌中功能性前噬菌体及其位置与序列。但是该发明一方面依赖于细菌基因组,而非噬菌体基因组的测序数据,另外一方面也只考虑了高通量测序数据中的噬菌体信息挖掘。
可见,传统的噬菌体鉴定方法依赖生物培养,耗时费力,效率十分低下,难以快速获取环境样本中的噬菌体信息,且很难同时建立噬菌体与多个宿主的侵染关系。此外,随着基因组测序技术的快速发展,第三代测序技术纳米孔测序技术已经逐步在世界上进行推广,而目前针对纳米孔测序数据的噬菌体鉴定和宿主预测方法非常缺乏。
发明内容
本申请提供一种基于纳米孔和高通量测序数据的噬菌体鉴定和宿主预测方法,以解决上述现有技术中的相关问题和缺陷,该方法既能同时满足纳米孔测序数据和高通量测序数据的分析要求,又能准确鉴定测序数据中的噬菌体序列,并预测噬菌体与宿主的对应关系。
本申请的第一方面,提供的基于纳米孔和高通量测序数据的噬菌体鉴定和宿主预测方法,从待测DNA样本中获得原始纳米孔测序数据和原始高通量测序数据,随后进行噬菌体鉴定和宿主预测,包括以下步骤:
S1:设置第一质量值过滤参数,去除原始纳米孔测序数据中平均质量值低于第一质量值过滤参数的序列,得到过滤后的纳米孔序列;
S2:将过滤后的纳米孔序列进行长度分析,设置第一序列长度参数,并去除序列长度小于所述第一序列长度参数的短序列,得到质控过滤后的纳米孔长序列;
S3:将原始高通量测序数据中含有接头的序列去除,得到过滤后的高通量测序数据;
S4:将过滤后的高通量测序数据中N含量超过10%的序列去除,设置第二质量值过滤参数,并将去除后的高通量序列中超过50%的碱基质量值低于所述第二质量值过滤参数的序列再去除,得到质控过滤后的高通量短序列;
S5:将质控过滤后的纳米孔长序列和质控过滤后的高通量短序列进行混合组装,拼接出待鉴定的噬菌体序列信息,设置第二序列长度参数,并去除拼接后的序列长度小于所述第二序列长度参数的短序列,得到混合组装后的噬菌体序列;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏省环境工程技术有限公司,未经江苏省环境工程技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211107292.X/2.html,转载请声明来源钻瓜专利网。





