[发明专利]一种同源假基因变异检测的方法有效
申请号: | 201911328534.6 | 申请日: | 2019-12-20 |
公开(公告)号: | CN111081315B | 公开(公告)日: | 2023-06-06 |
发明(设计)人: | 梁萌萌;余伟师;栗海波;李珉 | 申请(专利权)人: | 苏州赛美科基因科技有限公司 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G16B20/30 |
代理公司: | 南京九致知识产权代理事务所(普通合伙) 32307 | 代理人: | 严巧巧 |
地址: | 215131 江苏省苏州市相城区*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 同源 基因 变异 检测 方法 | ||
1.一种同源假基因变异检测的方法,其特征在于:包括以下步骤:
根据NCBI数据库的基因序列选取真基因构建参考基因集;其中,所述真基因包括1GB个碱基对;
随机获取正常样本原始数据创建对照集,对对照集正常样本原始数据与所述参考基因集进行数据比对,得到对照集比对结果;
根据所述对照集比对结果,对对照集中的每个样本进行变异检测,构建对照集变异位点频率数据;
获取实测样本原始数据,对所述实测样本原始数据与所述参考基因集进行数据比对,得到实测样本比对结果;对所述实测样本比对结果进行变异位点检测,得到实测样本变异位点检测结果;其中,对所述实测样本原始数据先进行质控;
将所述实测样本变异位点检测结果与所述对照集变异位点频率数据进行位点比对筛查,去除假阳性位点,得到实测样本的基因变异位点;其中,当某位点的对照集变异频率≥0.5时,实测样本对应变异位点归结为假阳性位点;当某位点的对照集变异频率≥0.1且对照集变异频率<0.5时,实测样本对应变异位点归结为人群多态性位点;当某位点的对照集变异频率<0.5时,实测样本对应变异位点归为特有变异位点。
2.如权利要求1所述的同源假基因变异检测的方法,其特征在于:构建参考基因集包括以下步骤:
收集NCBI数据库的基因全长序列,创建文本文件;
创建基因对比索引文件;
创建基因序列信息文件。
3.如权利要求2所述的同源假基因变异检测的方法,其特征在于:在随机获取正常样本原始数据创建对照集后,对所述对照集正常样本原始数据先进行质控。
4.如权利要求3所述的同源假基因变异检测的方法,其特征在于:所述质控包括以下步骤:
去除序列中接头序列和/或序列两端质量值低于30的碱基和/或N碱基数目大于5的序列;
剔除序列长度小于35个碱基对的序列。
5.如权利要求4所述的同源假基因变异检测的方法,其特征在于:与参考基因集进行数据比对包括以下步骤:
将质控后的对照集样本与原始参考基因集比对,获得原始比对结果文件;
对所述原始比对结果文件进行排序,产生排序结果文件;
对所述排序结果文件进行去除重复序列处理,产生去重排序结果文件;
对所述去重排序结果文件进行局部重排和碱基质量矫正,得到比对结果。
6.如权利要求5所述的同源假基因变异检测的方法,其特征在于:构建对照集变异位点频率数据包括以下步骤:
对对照集中每个对照样本的每个参考碱基进行变异检测,得到对照集中所有样本变异检测结果文件;
基于所述对照集中所有样本变异检测结果文件,进行变异位点合并处理,得到对照集群体的变异结果文件;
基于所述对照集群体的变异结果文件,对每个变异位点进行频率统计,得到对照集突变频率统计结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州赛美科基因科技有限公司,未经苏州赛美科基因科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911328534.6/1.html,转载请声明来源钻瓜专利网。