[发明专利]一种CRISPR目标区间变异检测的分析方法在审
申请号: | 202011596528.1 | 申请日: | 2020-12-29 |
公开(公告)号: | CN112687331A | 公开(公告)日: | 2021-04-20 |
发明(设计)人: | 陈全明;姜丽荣;孙子奎 | 申请(专利权)人: | 上海派森诺生物科技股份有限公司 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G16B20/50;G16B40/00;G16B50/30 |
代理公司: | 上海点威知识产权代理有限公司 31326 | 代理人: | 胡志强 |
地址: | 200030 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 crispr 目标 区间 变异 检测 分析 方法 | ||
1.一种CRISPR目标区间变异检测的分析方法,其特征在于,包括下列步骤:
1)将高质量测序数据使用flash软件将两条reads按照overlap进行合并,再使用cd_hit软件进行聚类,获得聚类结果与每一类代表性序列;
2)使用mafft软件将聚类的代表性序列与目标区间进行序列的多重比对,扫描目标区间,根据扫描结果查找出突变;
3)根据步骤2)中找出的突变进行分类,再结合步骤1)中的聚类结果中每一个cluster的reads数除以总聚类的reads数,得到每个cluster条目对应分类的突变率;
4)将步骤1)中的聚类结果的reads数与步骤2)中的扫描结果统计每种cluster的丰度,然后结合步骤3)中突变率,筛选,获得分析结果。
2.如权利要求1所述的一种CRISPR目标区间变异检测的分析方法,其特征在于:
步骤1)中的所述聚类为当长序列包含短序列时把短序列归为长序列。
3.如权利要求1所述的一种CRISPR目标区间变异检测的分析方法,其特征在于,所述步骤1)中高质量测序数据获得方法:
将原始二代下机数据按照barcode拆分成单个样本的fastq文件,将得到的所述fastq文件使用fastp软件过滤去接头处理得到高质量测序数据。
4.如权利要求1所述的一种CRISPR目标区间变异检测的分析方法,其特征在于:所述步骤1)中高质量测序数据使用flash软件将两条reads根据overlap合并成一条长reads;将得到的所述长reads的fastq文件转化为fasta格式的文件,使用cd-hit软件对转化后的所述fasta格式的文件内序列进行聚类,所述聚类结果为各个cluster的reads数以及各个cluster的代表性序列。
5.如权利要求1所述的一种CRISPR目标区间变异检测的分析方法,其特征在于:使用mafft软件将聚类结果中的各个cluster的代表性序列与目标区间进行序列进行两两比对。
6.如权利要求1所述的一种CRISPR目标区间变异检测的分析方法,其特征在于:
所述步骤4)中筛选为筛选高频cluster与目标区间高频的突变位点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海派森诺生物科技股份有限公司,未经上海派森诺生物科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011596528.1/1.html,转载请声明来源钻瓜专利网。