[发明专利]一种基于三代全基因组测序数据的植物线粒体基因组多构型组装方法在审

专利信息
申请号: 202211009304.5 申请日: 2022-08-22
公开(公告)号: CN115449543A 公开(公告)日: 2022-12-09
发明(设计)人: 毕长伟;渠堰墅;尹佟明;杨金宏;孙宁;王苏燕 申请(专利权)人: 南京林业大学
主分类号: C12Q1/6869 分类号: C12Q1/6869;C12Q1/6895;G16B20/30
代理公司: 南京智转慧移知识产权代理有限公司 32649 代理人: 金伟
地址: 210037 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 三代全 基因组 序数 植物 线粒体 构型 组装 方法
【权利要求书】:

1.一种基于三代全基因组测序数据的植物线粒体基因组多构型组装方法,其特征在于,包括:

1)获取准确度>99%的第三代植物全基因组测序数据;

2)利用Perl脚本将测序数据中大于30kb长度的reads分别按照若干个不同步移进行打断,得到若干个原始的三代测序数据集;

3)利用Newbler v.3.0分别对步骤2)产生的若干个原始的三代测序数据集进行初步组装,得到初步组装的Contigs;

4)利用minimap2将原始reads比对到初步组装得到的Contigs上,并利用Samtoolsdepth获取每条Contigs的平均覆盖深度;

5)调用R语言分别绘制不同reads组装后的Contigs平均测序深度分布图,并根据植物细胞核、叶绿体和线粒体基因组Contigs序列的覆盖深度的不同,筛选出线粒体Contigs,并以序列长度较长的若干条线粒体Contig作为种子;

6)利用Perl脚本根据Newbler v.3.0组装得到的454ContigGraph.txt文件中包含的Contigs之间的联系关系,对线粒体种子Contig进行延伸,当延伸遇到重复序列导致的多分支时保留所有可能的连接并继续延伸,直至形成闭环或包括全部现有的植物线粒体基因组蛋白编码基因;如果在延伸可用的所有Contigs后并没有形成闭环或包括全部现有的植物线粒体基因组蛋白编码基因,则分别合并不同步移截断的测序数据,再次利用Newblerv.3.0进行组装,直至形成闭环或包括全部现有的植物线粒体基因组蛋白编码基因;

7)在种子Contig序列延伸过程中,利用Perl脚本记录Contigs的测序深度、长度及不同Contigs之间的连接关系,得到包含植物线粒体Contigs之间联系的GFA格式文件;

8)利用Bandage软件打开GFA文件,根据组装关系图去除覆盖度异常或无法形成环状结构的连接,得到准确的线粒体基因组组装关系图;

9)根据组装关系图中Contigs的连接顺序和正反向信息,利用Bandage从所有Contigs序列中提取相应序列并连接得到所有可能构型的线粒体基因组序列;

10)组装验证:利用BlastN将步骤9)得到的植物粒体基因组序列比对到全部现有的植物线粒体蛋白质编码基因,根据比对上的基因数量确认组装得到的线粒体基因组是完整的。

2.根据权利要求1所述基于三代全基因组测序数据的植物线粒体基因组多构型组装方法,其特征在于,步骤1)具体为:利用PacBio HiFi测序技术获取准确度>99%的植物第三代全基因组测序数据。

3.根据权利要求1所述基于三代全基因组测序数据的植物线粒体基因组多构型组装方法,其特征在于,步骤1)具体为:通过PacBio CLR和Nanopore测序获得的植物基因组测序数据,并利用同一样本的Illumina数据纠错或自身三代高深度数据进行纠错,得到准确度>99%的reads。

4.根据权利要求1所述基于三代全基因组测序数据的植物线粒体基因组多构型组装方法,其特征在于:步骤2)中所述不同步移长度有5个,不同步移之间长度差≥5k。

5.根据权利要求4所述基于三代全基因组测序数据的植物线粒体基因组多构型组装方法,其特征在于:步骤2)中所述不同步移有5个,分别是5k、10k、15k、20k、25k。

6.根据权利要求1所述基于三代全基因组测序数据的植物线粒体基因组多构型组装方法,其特征在于:所述现有的植物线粒体蛋白质编码基因库是从NCBI细胞器数据库中下载的所有植物线粒体基因组中的蛋白质编码基因。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京林业大学,未经南京林业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211009304.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top