[发明专利]向导RNA作用靶点的筛选方法、计算机存储介质及电子设备有效
申请号: | 202111257801.2 | 申请日: | 2021-10-27 |
公开(公告)号: | CN113990394B | 公开(公告)日: | 2023-01-24 |
发明(设计)人: | 胡杨俊;韩永红;许晓静 | 申请(专利权)人: | 云舟生物科技(广州)股份有限公司 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B20/30 |
代理公司: | 广州国鹏知识产权代理事务所(普通合伙) 44511 | 代理人: | 葛红 |
地址: | 510663 广东省广州市科学城掬泉*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 向导 rna 作用 筛选 方法 计算机 存储 介质 电子设备 | ||
本发明提供了一种向导RNA作用靶点的筛选方法、计算机存储介质及电子设备,方法包括以下步骤:S1、从基因序列库中获取PAM序列;S2、将PAM序列的NGG以及PAM序列的前n个碱基取出,生成向导RNA;S3、将向导RNA与基因序列库比对,判断向导RNA的基因在基因序列库中的位置;S4、获取向导RNA中每个基因上游的m个碱基,以及对应基因的碱基区域的向导RNA,在含有基因的向导RNA进行打靶,剔除没有基因的向导RNA;S5、剔除含有连续a个T的向导RNA;S6、剔除没有在转录本外显子上的向导RNA;S7、获取未被剔除的向导RNA,筛选含有设定前缀的转录本的向导RNA;S8、获取步骤S7得到的向导RNA的基因,形成具有设定前缀的转录本序列;S9、截取转录本序列中预定长度的序列。
技术领域
本发明涉及基因编辑领域,更具体地,涉及一种向导RNA作用靶点的筛选方法、计算机存储介质及电子设备。
背景技术
随着DNA测序技术的发展,众多生物的基因组序列信息已被公布,随后科研人员把转向对基因功能信息挖掘作为研究重点。基因敲除动物模型一直以来是在活体动物上从事基因功能研究、寻找合适药物作用靶点的重要工具。但是传统的基因敲除方法需要通过复杂的打靶载体构建、胚胎干细胞(ES细胞)的筛选、嵌合体繁育等一系列步骤,不仅操作流程繁琐,对实验人员的技术要求很高,而且成本高,耗时长,效率低。
例如,现有工具Cas-Designer所存在的缺陷为:需要一个基因一个基因的处理,耗时长,更不尽人意的是,基因必须根据NCBI数据库获取基因组序列,然后判断序列长度,小于或者等于1kb才可以进行筛选。假如序列的长度5kb,需要分5次进行筛选,该序列假如进行第二次筛选,也同样需要分成5次,比较繁琐,耗时长。
发明内容
为解决上述技术问题,一方面,本发明提供一种向导RNA作用靶点的筛选方法。
根据本发明实施例的向导RNA作用靶点的筛选方法,包括以下步骤:
S1、从基因序列库中获取PAM序列;
S2、将所述PAM序列的NGG以及所述PAM序列的前n个碱基取出,生成向导RNA,其中n为自然数;
S3、将所述向导RNA与所述基因序列库比对,判断所述向导RNA的基因在所述基因序列库中的位置;
S4、获取所述向导RNA中每个基因上游的m个碱基,以及对应基因的碱基区域的所述向导RNA,在含有基因的所述向导RNA进行打靶,剔除没有基因的所述向导RNA;
S5、剔除含有连续a个T的所述向导RNA;
S6、剔除没有在转录本外显子上的所述向导RNA;
S7、获取未被剔除的所述向导RNA,筛选含有设定前缀的转录本的所述向导RNA;
S8、获取步骤S7得到的所述向导RNA的基因,并将外显子组合,形成具有所述设定前缀的转录本序列;
S9、截取所述转录本序列中预定长度的序列。
根据本发明实施例的向导RNA作用靶点的筛选方法,筛选方法更严谨,能够得到更有价值的序列库。根据基因ID可以批量筛选作用靶点,质量更高,速度快,客户使用更方便。
根据本发明的一些实施例,所述基因序列库为NCBI,所述PAM序列为所述基因库序列中的序列正链和序列负链。
根据本发明的一些实施例,n=20,m=20。
根据本发明的一些实施例,步骤S4包括:将有打靶的位置按照顺序生成唯一的ID号,最终生成没有筛选的向导RNA背景库。
根据本发明的一些实施例,a≥4。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云舟生物科技(广州)股份有限公司,未经云舟生物科技(广州)股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111257801.2/2.html,转载请声明来源钻瓜专利网。