[发明专利]一种构建TALE重复序列的方法有效
申请号: | 201210276104.6 | 申请日: | 2012-08-03 |
公开(公告)号: | CN102787125A | 公开(公告)日: | 2012-11-21 |
发明(设计)人: | 黄鹏;张博;林硕;肖安 | 申请(专利权)人: | 北京大学 |
主分类号: | C12N15/31 | 分类号: | C12N15/31;C12N15/63;C12N15/10;C12N15/66;C12R1/64 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王朋飞;张庆敏 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 构建 tale 重复 序列 方法 | ||
技术领域
本发明属于分子生物学领域,涉及一种构建TALE重复序列的方法。
背景技术
对内源基因进行定点修饰不论对于生物学基础研究还是临床治疗都具有极大的吸引力。虽然人工锌指核酸酶(zinc finger nuclease)的出现大大促进了基因组靶向修饰技术,但是筛选出能够高效、特异结合特定DNA序列的锌指蛋白仍然是一个相当大的技术难题。来自于植物病原体Xanthomonas的transcription activator-like effector(TALE)能够侵染植物宿主,通过识别特异的DNA序列调控宿主植物内源基因的表达,降低宿主的抵抗力,提高其易感性(图1)。目前已知TALE家族有超过100个基因成员(Boch,J.& Bonas,U.,2010,Annu Rev Phytopathol,48:419-436.)。研究表明,TALE蛋白中的DNA结合结构域具有特异性识别并结合DNA序列的特性(Boch,J.et al.,Science,2009,326:1509-1512.),它主要由1到33个长度为33-35个氨基酸残基的重复单位(或称重复单元)串联后,再加上末尾的一个含有20个氨基酸残基的半重复单位构成;此外,位于重复区两端的部分非重复序列(N端的136个氨基酸和C端的63个氨基酸)对于TALE蛋白识别并结合DNA的效率和特异性也有重要帮助(图1)。即一个活性和特异性较高的TALE蛋白的DNA结合结构域除了包含1.5-33.5个TALE重复单位之外,应该还包括其N端和C端的部分非重复序列。其中每个重复单位以及末尾的半重复单位可特异地识别并结合一个特定的核苷酸靶位点。在每个重复单位中,+12和+13位的氨基酸残基是实现靶向识别特异DNA碱基的关键位点,被称作重复可变二残基(repeat variable di-residue,简称RVD)位点;其它位点的氨基酸残基则相对固定(图1)。不同的RVD能够分别特异识别A、T、C、G四种碱基。由此可见,相对于锌指蛋白,TALE结合DNA的方式更便于预测和设计,因此在生命科学基础理论研究、疾病模型建立、疾病预防与治疗,以及农林牧渔业经济物种遗传改造等领域具有广阔的应用前景。将TALE的DNA结合结构域与其它蛋白质不同的功能结构域融合后,可以得到各种衍生的融合蛋白,这样,在理论上就能够对特定的基因组位点进行靶向突变和修饰。例如, 与FokI核酸内切酶的切割结构域融合后,能够对基因组的特定靶位点进行定向切割,从而实现基因打靶(Christian,M.et al.,2010,Genetics,186:757-761.);与转录激活结构域或抑制结构域融合后,能够特异调控靶基因的表达(Zhang,F.et al.,2011,Nat Biotechnol,29:149-153.);与甲基化结构域融合后,应该能够甲基化基因组上的特定位点。TALE的DNA结合结构域与FokI的切割结构域融合形成的人工蛋白质称为TALE核酸酶(TALE nuclease,简称TALEN)(图3中的a)。目前,基于TALE的DNA改造技术越来越受到人们的青睐,而构建识别特定DNA序列的TALE就成为了这一技术中的关键步骤。然而,为了保证TALE蛋白识别DNA序列的特异性,人工构建的TALE蛋白DNA结合结构域通常需要含有10个以上的重复单元,总长度大于1000bp。因此,TALE串联重复序列的构建难度较大,成为TALE应用中的主要瓶颈。目前,构建TALE串联重复序列及TALE蛋白DNA结合结构域的主要方法包括人工合成全长的TALE序列,以及基于Golden Gate的载体克隆技术等两种方法。Golden Gate的基本原理如下:把IIS类限制性内切酶的识别位点分别反向放置在任何一段DNA片段的5’和3’端,通过酶切反应,识别位点本身被切除,并在5’和3’留下粘性末端。如果两段DNA序列具有互补的粘性末端,就可以通过连接反应连接在一起。将多段序列分别设计具有序列不同的互补性的粘性末端,就可以通过一次连接反应将这些序列顺序连接起来(Engler,C.et al.,2009,PLoS ONE,4:e5553.)(图2)。AvrBs3是TALE家族的一个蛋白,它含有17.5个重复单元,每个重复单元含有34个氨基酸。以AvrBs3为框架,通过PCR对分别包括识别四种碱基的RVD的4种重复单位两端引入BsaI的酶切位点和粘性末端序列,可以得到17×4=68种基础模块。由于Golden Gate法每次可以高效连接9个DNA片段,因此可以分两次连接,最终得到含有17.5个重复单位的人工TALE蛋白,该蛋白可识别长度为18个核苷酸的特异的DNA序列(Weber,E.et al.,2011,PLoS ONE,6:e19722.)。Morbitzer等人也报道了分两步构建TALE的类似方法(Morbitzer,R.et al.,2011,Nucleic Acids Res,39:5790-5799.)。另外一种方法对上述的Golden Gate方法进行了一定的改进,主要利用了在每一对天然存在的TALE重复单元之间交界位置的Gly-Leu双氨基酸的编码序列。根据密码子的简并性,编码这两个氨基酸的密码子一共有四个碱基可替换(编码Gly有4个密码子,编码Leu有6个密码子),因此一共可以有24种不同的组合。这样就可以人为设计出24种不同的TALE重复单元的交界序列。在具体实验中,可以先 使用12对不同的PCR引物对每一种RVD重复进行克隆,并加入IIS类内切酶的识别位点。酶切后,将每4个重复进行连接,并用PCR进行扩增,得到3组4-重复体;再次酶切、连接并PCR扩增,得到12-重复体。最后连入目的载体中(Zhang,F.et al.,2011,Nat Biotechnol,29:149-153.)。还有一种稍有不同的方法则是利用了存在于AvrBs3等TALE中的IIS型限制性内切酶BsmBI的酶切位点。它紧邻于+18和+19位的密码子,即GCGCTG之后。使用BsmBI酶切后,可产生GCTG凸出的粘性末端。根据密码子的简并性,GC(A/T/C/G)(T或C)TG这8种密码子组合都能产生与内源编码相同的氨基酸密码子,从而可以人工设计出8种不同的粘性末端。接下来分别合成带有这8种末端的含有识别4种碱基的RVD的模块,一共分为8组。使用BsmBI酶切后,可得到独特的5’和3’粘性末端,顺序连接,一次可以合成8个识别特定DNA序列的重复单位。经过二次连接可获得识别16个或24个碱基的重复序列(Li,T.et al.,2011,Nucleic Acids Res,doi:10.1093/nar/gkr188)。总之,这些方法都是基于Golden Gate的载体构建理念,人为地在重复单元的两侧设计出不同的粘性末端序列,并依次连接而成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210276104.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:冶金添加合金的装置
- 下一篇:一种用于化工制气的出气冷却系统