[发明专利]同源四倍体基因组分型组装的方法和装置、构建染色体的装置有效
申请号: | 202211081173.1 | 申请日: | 2022-09-06 |
公开(公告)号: | CN115148289B | 公开(公告)日: | 2023-01-24 |
发明(设计)人: | 李志民;杨伟飞;王娟;张雪梅;李晓波;涂成芳;刘涛;王众司 | 申请(专利权)人: | 安诺优达基因科技(北京)有限公司 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B30/20;G16B20/20 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100176 北京市大兴区北京经济*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 同源 四倍体 基因 组分 组装 方法 装置 构建 染色体 | ||
本发明公开了一种同源四倍体基因组分型组装的方法和装置、构建染色体的方法和装置及其应用。该分型组装的方法包括:步骤1、将样本的测序数据集与近缘二倍体物种的分型后的参考基因组分别进行比对;根据比对结果鉴定基因组变异信息并分型,得到能分型的且与参考基因组相似的测序数据集I、能分型的且与参考基因组不相似的测序数据集II,以及无法分型的测序数据集III;步骤2、提取单碱基深度≥1/2平均深度的测序数据集IV;步骤3、将测序数据集I与测序数据集III组装;将测序数据集II与测序数据集III、测序数据集IV组装。本发明的方法和装置具有良好的分型组装效果,可以应用于高度同源的同源四倍体样本,而且花费较低,取样容易。
技术领域
本发明涉及生物技术领域,具体地,涉及一种同源四倍体基因组分型组装的方法和装置、构建染色体的方法和装置、通过上述方法和/或装置得到的基因组和染色体序列及其应用。
背景技术
基因组组装技术的应用极大地推动了基础生命科学和医学研究领域的发展。传统的基因组组装策略由于忽略同源染色体之间的差异,不可避免的会组装为嵌合体基因组,无法区分同源染色体的等位基因表达的差异,同源染色体修饰差异等。为了打破这种局限性,单体型基因组组装技术顺势而生,已成为高精确基因组组装和精准位点筛选的突破性技术。
目前针对同源四倍体的基因组分型组装技术有2种思路,但是这两种思路都有自己的局限性。
第一种方法是基于ALLHiC方法的四倍体基因组分型技术,目前主要成功应用的四倍体主要有甘蔗和苜蓿,首先是根据近缘物种的注释进行,将研究物种分群;第二步是根据构建的同源片段文件,去除同源染色体之间的hic互作关系;第三步是根据修剪后的bam文件,对contigs进行聚类;第四步是根据原始的bam文件,找回部分未聚类的contigs序列,根据hic互作信号,将这些contig分到对应的聚类群中;第五步是针对聚类的结果进行排序;最后一步是构建每条染色体的agp,序列信息和Hi-C互作热图。该方法的优点是依赖信息少,能够高质量地完成基因组的分型工作,获得高质量的基因组结果;缺点是针对同源性比较高的四倍体,分型效果较差,同源性越高的区域,只会组装出的一套序列,这样对第一步的同源信息表的构建影响比较大,甚至部分高度同源的四倍体无法完整的构建染色体。ALLHiC对同源四倍体分型原理的流程图可以如图5所示。
第二种方法是配子体单细胞测序辅助分型方法,该方法是将配子体进行单细胞测序和三代测序技术相结合的方法,该方法成功应用于人和同源四倍体马铃薯的分型基因组组装工作。首先,获取材料花粉和组织材料,组织材料进行三代测序和Hi-C测序,花粉(单倍体)进行10X单细胞测序,对三代测序数据进行初步组装,同时把花粉单细胞测序数据进行拆分,根据拆分的结果,把初步组装的序列分成4套,每套的基因组再利用HiC数据进行染色体的连接,最终形成染色体级别的基因,该方法的局限性是花费较大,部分样本取样困难。单细胞测序辅助分型原理的流程图可以如图6所示。
综上,现有技术针对同源性比较高的四倍体,主要存在分型组装的效果差;对配子进行单细胞测序等导致花费较大;获取花粉和组织材料样本取样困难等问题。
发明内容
针对上述现有技术存在的问题,本发明提供一种同源四倍体基因组分型组装的方法和装置、构建染色体的方法和装置。本发明的方法和装置可以应用于高度同源的同源四倍体样本,具有良好的分型组装结果,而且本发明的方法和装置不需要额外的测序技术,无需对配子进行单细胞测序进而能够降低花费,不需要获取材料花粉和组织材料等因此样本取样容易。
本发明一方面提供了一种同源四倍体基因组的分型组装方法,包括:
步骤1、将同源四倍体基因组样本的测序数据集与所述样本的近缘二倍体物种的分型后的参考基因组分别进行比对;根据比对结果鉴定基因组变异信息并分型,得到能分型的且与参考基因组相似的测序数据集I、能分型的且与参考基因组不相似的测序数据集II,以及无法分型的测序数据集III;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安诺优达基因科技(北京)有限公司,未经安诺优达基因科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211081173.1/2.html,转载请声明来源钻瓜专利网。