[发明专利]一种筛选新型CRISPR-Cas系统的方法和装置有效
申请号: | 201610741844.0 | 申请日: | 2016-08-26 |
公开(公告)号: | CN107784200B | 公开(公告)日: | 2020-11-06 |
发明(设计)人: | 李芳;杨子翊;顾颖;李俊桦 | 申请(专利权)人: | 深圳华大生命科学研究院 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B25/00 |
代理公司: | 深圳鼎合诚知识产权代理有限公司 44281 | 代理人: | 孙银行;彭家恩 |
地址: | 518083 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 筛选 新型 crispr cas 系统 方法 装置 | ||
本发明公开了一种筛选新型CRISPR‑Cas系统的方法和装置,该方法包括:提供菌株的预测出的基因序列和蛋白序列;获取CRISPR区域和含有cas1注释信息的蛋白;寻找cas1或重复序列附近第一长度范围内大于第二长度的蛋白,并提取菌株候选区域的蛋白序列;进行比对;提取出蛋白一致性最高的注释结果,筛选出与cas9或cpf1型具有非100%比对率的高度同源菌株,进行二级结构预测,得到蛋白的元件排布位置信息,并将不符合cas9或cpf1元件排布的蛋白挑选出来,作为候选蛋白。本发明的方法可对单菌种基因组数据进行分析,挑选出可能属于新型CRISPR‑Cas系统的菌株蛋白。
技术领域
本发明涉及基因编辑技术领域,尤其涉及一种筛选新型CRISPR-Cas系统的方法和装置。
背景技术
CRISPR(Clustered regularly interspaced short palindromic repeats),被称为规律成簇间隔短回文重复,实际上是一种基因编辑器,是大多数细菌及古细菌中的一种天然免疫方式。通过对CRISPR簇的侧翼序列分析发现,在其附近存在一个多态性家族基因,并且与CRISPR区域共同发挥作用,因此被命名为CRISPR关联基因(CRISPRassociated),缩写为Cas。大多数的CRISPR-Cas系统都含有cas1蛋白,而且cas1是Cas家族中较为保守的蛋白。根据效应模块的结构,目前被发现的CRISPR-Cas系统主要有两类:一类(Class1)包含多个Cas蛋白并有多个效应蛋白(effector)共同作用,主要包括I型(TypeI)、III型(Type III);二类(Class2)仅包含一个巨大的效应蛋白,包括Ⅱ型(TypeⅡ)和Ⅴ型(TypeⅤ)。目前,Class2主要有Cas9系统(Ⅱ型)和Cpf1(Ⅴ型)系统,并且广泛用于基因编辑应用中(Shmakov S,Abudayyeh OO,et al.“Discovery and FunctionalCharacterization of Diverse Class 2CRISPR-Cas Systems.”Mol Cell.2015,60(3):385-97,通过引用并入本文)。
现有的CRISPR-Cas系统仍存在一些缺点,如CRISPR-Cas9需要特殊的载体或者牺牲转染效率,并且在哺乳动物细胞中很容易被内源RNA干扰,因此寻找新型的基因编辑系统非常重要。
发明内容
本发明提供一种筛选新型CRISPR-Cas系统的方法和装置,可对单菌种基因组数据进行分析,挑选出可能属于新型CRISPR-Cas系统的菌株蛋白。
根据本发明的第一方面,本发明提供一种筛选新型CRISPR-Cas系统的方法,包括:提供菌株的预测出的基因序列和蛋白序列;获取上述基因序列中的CRISPR区域,并对上述蛋白序列进行注释以获得含有cas1注释信息的蛋白;寻找上述cas1或上述CRISPR区域的重复序列附近第一长度范围内大于第二长度的蛋白,并提取满足设定条件的菌株候选区域的蛋白序列;将上述满足设定条件的菌株候选区域的蛋白序列与蛋白质数据库进行比对,获得比对结果;从上述比对结果中,提取出蛋白一致性最高的注释结果,并筛选出与cas9或cpf1型具有非100%比对率的高度同源菌株;对上述高度同源菌株的蛋白序列进行二级结构预测,得到蛋白的元件排布位置信息,并将不符合cas9或cpf1元件排布的蛋白挑选出来,作为候选蛋白。
进一步地,上述设定条件包括如下至少一个:
(a)有cas1和CRISPR区域中的重复序列,并且不属于I型或III型,而且上述cas1与上述重复序列在同一条组装片段上,上述cas1区域附近第一长度范围内具有大于第二长度的蛋白;
(b)无cas1,但有CRISPR区域中的重复序列,上述重复序列区域附近第一长度范围内具有大于第二长度的蛋白。
(c)有cas1,没有CRISPR区域中的重复序列,cas1区域附近第一长度范围内具有大于第二长度的蛋白。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳华大生命科学研究院,未经深圳华大生命科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610741844.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:结合物联网技术的脏衣管理清洁系统与方法
- 下一篇:一种复合布的除尘装置