[发明专利]一种CRISPR目标区间变异检测的分析方法在审
申请号: | 202011596528.1 | 申请日: | 2020-12-29 |
公开(公告)号: | CN112687331A | 公开(公告)日: | 2021-04-20 |
发明(设计)人: | 陈全明;姜丽荣;孙子奎 | 申请(专利权)人: | 上海派森诺生物科技股份有限公司 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G16B20/50;G16B40/00;G16B50/30 |
代理公司: | 上海点威知识产权代理有限公司 31326 | 代理人: | 胡志强 |
地址: | 200030 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 crispr 目标 区间 变异 检测 分析 方法 | ||
本发明公开了一种CRISPR目标区间变异检测的分析方法,1)将高质量测序数据使用flash软件将两条reads按照overlap进行合并,再使用cd_hit软件按照短序列与长序列完全相似的标准进行聚类,获得聚类结果;2)使用mafft软件将聚类结果与目标区间进行序列的多重比对,扫描目标区间,根据扫描结果查找出突变;3)根据步骤2)中找出的突变进行分类,再结合步骤1)中的聚类结果中每一个cluster的reads数除以总聚类的reads数,得到每个cluster条目对应分类的突变率;通过本发明的分析得到的结果更接近真实情况,提高了准确率。
技术领域
本发明涉及基因检测分析技术领域,尤其涉及一种CRISPR目标区间变异检测的分析方法。
背景技术
Clustered regularly interspaced short palindromic repeats(CRISPR)——规律成簇的间隔短回文重复和CRISPR-associated protein 9(Cas9),共同组成了一套系统,是细菌用来抵御外源DNA入侵的天然防御系统。目前利用这个原理构建了很强的RNA引导的DNA靶向平台——主要用来基因组编辑、转录扰乱、表观遗传调控等。
CRISPR/Cas9从2013年以来,凭借其特有的敲除靶序列效果,迅速风靡科研界。与传统的siRNA文库和shRNA文库比较,有更加严苛的筛选标准,更有效去除假阳性,而且有着成本低廉、构建简单、操作方便的诸多优点。
而现有的CRISPR分析主要是集中在针对目标区间单位点碱基突变的分析,而忽略了完整序列在成功转导后的比率,从而造成假阳性的情况。
发明内容
本发明的提供一种CRISPR目标区间变异检测的分析方法。
本发明的方案是:
一种CRISPR目标区间变异检测的分析方法,包括下列步骤:
1)将高质量测序数据使用flash软件将两条reads按照overlap进行合并,再使用cd_hit软件进行聚类,获得聚类结果与每一类代表性序列;
2)使用mafft软件将聚类的代表性序列与目标区间进行序列的多重比对,扫描目标区间,根据扫描结果查找出突变;
3)根据步骤2)中找出的突变进行分类,再结合步骤1)中的聚类结果中每一个cluster的reads数除以总聚类的reads数,得到每个cluster条目对应分类的突变率;
4)将步骤1)中的聚类结果的reads数与步骤2)中的扫描结果统计每种cluster的丰度,然后结合步骤3)中突变率,筛选,获得分析结果。
作为优选的技术方案,步骤1)中的所述聚类为当长序列包含短序列时把短序列归为长序列。
作为优选的技术方案,所述步骤1)中高质量测序数据获得方法:
将原始二代下机数据按照barcode拆分成单个样本的fastq文件,将得到的所述fastq文件使用fastp软件过滤去接头处理得到高质量测序数据。
作为优选的技术方案,所述步骤1)中高质量测序数据使用flash软件将两条reads根据overlap合并成一条长reads;将得到的所述长reads的fastq文件转化为fasta格式的文件,使用cd-hit软件对转化后的所述fasta格式的文件内序列进行聚类,所述聚类结果为各个cluster的reads数以及各个cluster的代表性序列;
作为优选的技术方案,使用mafft软件将聚类结果中的各个cluster的代表性序列与目标区间进行序列进行两两比对。
作为优选的技术方案,所述步骤4)中筛选为筛选高频cluster与目标区间高频的突变位点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海派森诺生物科技股份有限公司,未经上海派森诺生物科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011596528.1/2.html,转载请声明来源钻瓜专利网。