[发明专利]一种基于三代全基因组测序数据的植物线粒体基因组多构型组装方法在审
申请号: | 202211009304.5 | 申请日: | 2022-08-22 |
公开(公告)号: | CN115449543A | 公开(公告)日: | 2022-12-09 |
发明(设计)人: | 毕长伟;渠堰墅;尹佟明;杨金宏;孙宁;王苏燕 | 申请(专利权)人: | 南京林业大学 |
主分类号: | C12Q1/6869 | 分类号: | C12Q1/6869;C12Q1/6895;G16B20/30 |
代理公司: | 南京智转慧移知识产权代理有限公司 32649 | 代理人: | 金伟 |
地址: | 210037 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 三代全 基因组 序数 植物 线粒体 构型 组装 方法 | ||
本发明公开了一种基于三代全基因组测序数据的植物线粒体基因组多构型组装方法,属于生物信息技术领域。本发明利用NewBler组装软件可保留所有Contigs之间可能连接的特点,以及三代WGS数据中线粒体与叶绿体、细胞核序列的拷贝数差异,且三代测序reads可跨过重复序列的优势,构建一套适合三代全平台(PacBio/Nanopore/HiFi)测序数据的植物线粒体基因组多构型组装流程。该流程在组装线粒体基因组过程中遇到重复序列导致的多分支时能保留所有可能的连接并继续延伸,直至形成闭环,因此能够解析线粒体基因组的所有可能构型,相比现有植物线粒体基因组组装技术具有准确度更高的优点。
技术领域
本发明属于生物信息技术领域,更具体地说,涉及一种基于三代全基因组测序数据的植物线粒体基因组多构型组装方法。
背景技术
随着第三代单分子测序技术的迅猛发展,越来越多的植物完成了全基因组测序(WGS)及组装。截至2022年2月底,NCBI基因组数据库(https://www.ncbi.nlm.nih.gov/genome/)上共收录了约2000个植物细胞核基因组序列和超过6500个叶绿体基因组序列,而植物线粒体基因组仅有437个,其中陆地植物仅有323个。植物线粒体作为细胞有氧呼吸的主要场所,不仅为细胞复杂生理活动供能,还广泛参与植物的重要生长发育过程。研究发现,植物线粒体基因组结构变化与籽粒发育、细胞质雄性不育(CMS)和种子老化等重要性状密切相关,因此精准解析植物线粒体基因组复杂结构及其形成机制,不仅有助于阐明核质互作机制、植物进化等重要的科学问题,还将推动CMS不育系在杂交制种和作物杂种优势利用等研究中发挥重要作用。
然而,植物线粒体基因组中含有大量基因水平转移(HGT)序列和重复序列,这些序列在线粒体基因组组装过程中会干扰序列延伸,导致组装结果片段化,难以获得完整的线粒体基因组序列。近年来,测序成本的下降和组装算法的进步,催生了海量的植物全基因组数据,也促使植物线粒体基因组研究快速发展,NCBI每年收录的植物线粒体基因组序列从2011年的14个增长到2021年的70个,但仍严重滞后于植物叶绿体和细胞核基因组。目前,植物线粒体基因组组装策略主要有两种:(1)分离纯化线粒体DNA后,再进行测序和组装;(2)直接从植物WGS数据中组装。但是,以上两种组装策略存在一个共同缺陷,即在遇到重组或HGT导致的多分支结构时,通常会将Contigs直接打断或只选择reads支持数最多的路径继续延伸,而忽略了其他可能存在的连接。很多已发表的植物线粒体基因组都仅组装出单一的主环(Master circle)结构,并未解析线粒体基因组的所有可能构型,这严重阻碍了植物线粒体结构及功能基因组学研究的发展。
近年来,植物全基因组测序数据呈井喷式涌现,如何从海量的WGS数据中获取完整的线粒体基因组序列并加以利用,成为植物线粒体基因组在分子生物学、系统发育学和遗传学等领域的重点研究方向之一,由此催生了一大批针对WGS数据的植物细胞器基因组组装方法及相关软件。通过分析NCBI细胞器数据库近五年(2017年-2022年2月)收录的植物线粒体基因组,我们发现目前植物线粒体基因组组装软件主要有6款,按照使用频次从高到低依次为:SPAdes v.3.0(48个物种)、Canu(20个)、Newbler(11个)、SMARTdenovo(9个)、NOVOPlasty(7个)和GetOrganelle(7个)。此外,还有少数植物利用MIRA、Falcon、HGAP、Flye等软件完成线粒体基因组组装。下面按照测序数据所使用的测序平台介绍常用的6款线粒体基因组组装软件:
(1)Roche 454测序平台:Newbler是一款针对Roche 454测序数据的组装软件,而随着测序技术的更新迭代,454测序平台已在2016年关闭,目前研究者用来组装线粒体基因组的454数据大多是2015年之前测序的数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京林业大学,未经南京林业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211009304.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种自监控无线物联网电能表
- 下一篇:一种集中管控接口的方法