[发明专利]利用外切酶组合消除三维基因组学技术噪音的方法及应用在审
申请号: | 201810589904.0 | 申请日: | 2018-06-08 |
公开(公告)号: | CN108804872A | 公开(公告)日: | 2018-11-13 |
发明(设计)人: | 张玉波;孔思远;张高林;黄其通;范磊;李清;黄雷;彭艳玲 | 申请(专利权)人: | 中国农业科学院农业基因组研究所 |
主分类号: | G06F19/18 | 分类号: | G06F19/18;G06F19/20 |
代理公司: | 北京科亿知识产权代理事务所(普通合伙) 11350 | 代理人: | 汤东凤 |
地址: | 518120 广东省深圳市大鹏*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 外切酶 基因组学 技术噪音 三维 线性DNA 组合酶 测序 邻近 关键步骤 技术连接 生物信息 无效信息 有效手段 环状DNA 大数据 假阳性 应用 噪音 终端 节约 表现 | ||
本发明公开了一种利用外切酶组合消除三维基因组学技术噪音的方法及应用,该方法是通过在三维基因组学技术的关键步骤邻近连接时加入外切酶组合消除邻近连接后线性DNA,提高环状有效互作比例。本发明通过外切酶组合在消除线性DNA中的优越表现为在C‑技术连接后通过外切酶组合酶切消除“噪音”提供了一种有效手段,本发明利用外切酶组合酶切反应消除三维基因组学技术噪音的方法具有方便、快捷、高效的优点,能够降低产生假阳性产物或者信号的可能性,增加有效互作环状DNA占比,大大提高终端有效互作数据产出比例,节约测序空间,降低测序成本,简化了后期利用复杂的生物信息手段消除大数据中无效信息所耗费的资源。
技术领域
本发明涉及基因组测序技术领域,具体属于三维基因组学,涉及一种利用外切酶组合消除三维基因组学技术噪音的方法及应用。
背景技术
染色质构象捕获技术(C-技术)是三维基因组学技术中的重要技术。C-技术广泛应用于阐明基因组互作折叠模式,重构基因组三维拓扑结构,研究生物的转录调控和细胞命运决定等重要生物学问题。C-技术,主要由3C技术(染色质构象捕获技术)发展而来,包括3C,4C(环化染色质构象捕获技术),5C(染色质构象捕获碳拷贝技术),Hi-C(高通量染色质构象捕捉测序技术),ChIA-PET(基于配对末端标签测序的染色质交互作用分析技术)。比如,通过3C技术,研究人员发现了影响肌生成分化的H19-Igf2位点互作;通过Hi-C技术,研究人员鉴定了基因组上CTCF/Cohesin蛋白锚定的相对保守的TAD(拓扑关联域),以及TAD内部动态变化与细胞特异的基因表达的关系。正是通过这些不断发展的C-技术,研究人员可以从三维基因组学的独特视角探究基因组动态变化与转录调控功能的关系,重构了真核生物中三维基因组结构。
基因组内大部分互作是蛋白小体参与的基因组DNA间的互作(包括启动子与增强子互作、启动子与启动子互作、增强子与增强子等)。C-技术主要原理为基因组片段化以后蛋白小体将其介导的DNA间的互作分离出来,蛋白小体分子内邻近连接之后并通过PCR或者NGS(下一代)测序将互作的DNA读取出来(见图2)。所以邻近连接是包括3C、4C、5C、ChIA-PET和Hi-C在内所有C-技术的关键步骤。从3C技术发展到Hi-C技术,研究人员可以通过一次实验从“一对一”的抓取单一互作到“全对全”的抓取全基因组互作。C-技术依然具有很高的噪音,并且需要繁琐的生物信息工作去去除噪音挖掘有效互作。目前C-技术依然是邻近连接后直接进行PCR检测或者纯化DNA进行后续生物素固定、建库步骤。由于基因组是酶切片段化的,邻近连接之后会混杂不需要的线性DNA(即“噪音”),比如酶切不完全的DNA(内部片段Internal、再连接、连续连接),未成功连接的生物素标记DNA(悬挂末端Dangling end),未互作的不同蛋白小体间连接后的DNA(分子间连接DNA),连接到游离片段的DNA(随机连接DNA)(见图1)。邻近连接之后,首尾连接形成的环状DNA绝大部分为有效连接(少量自连接除外),同时体系中混杂的这些不需要的各种线性DNA正是C-技术噪音的主要来源。对3C、4C、5C来说,邻近连接后各种线性噪音存在情况下,PCR会产生异源双链(heteroduplexes)、嵌和链(chimeras)等假阳性产物以及扩增偏差(biases,模板DNA拓扑形状不一致)。对于Hi-C、ChIA-PET来说,邻近连接后各种线性噪音存在情况下,会占用大量测序空间,使得有效互作占比低,浪费测序资源。比如,经典ChIA-PET技术得到的可靠有效互作比例仅有0.042%。经典Hi-C技术得到的数据中约60%为无效互作。目前尚未有报道重视此关键连接步骤所带来的高噪音,去除这些线性DNA噪音,是对三维基因组学技术(C-技术)消除高噪音、增加技术效率和结果特异性的重要着力点。
发明内容
针对上述技术问题,本发明提供了一种利用外切酶组合消除三维基因组学技术噪音的方法,其中,在三维基因组学技术的关键步骤邻近连接时加入外切酶组合消除邻近连接后线性DNA,提高环状有效互作比例。
所述利用外切酶组合消除三维基因组学技术噪音的方法,其中,所述外切酶组合包括两个外切酶Lambda和RecJF。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国农业科学院农业基因组研究所,未经中国农业科学院农业基因组研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810589904.0/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用