[发明专利]基于贝叶斯与泊松分布检验的已知变异检出方法和装置有效

专利信息
申请号: 201610407552.3 申请日: 2016-06-08
公开(公告)号: CN107480470B 公开(公告)日: 2020-08-11
发明(设计)人: 刘继龙;刘足;程少敏;郭凤明;李世勇 申请(专利权)人: 广州华大基因医学检验所有限公司;广州华大基因科技有限公司
主分类号: G16B20/20 分类号: G16B20/20;G16B20/50
代理公司: 深圳鼎合诚知识产权代理有限公司 44281 代理人: 孙银行;彭家恩
地址: 510006 广东省广州市番禺区大学城小谷围*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 贝叶斯 分布 检验 已知 变异 检出 方法 装置
【说明书】:

发明公开了一种基于贝叶斯与泊松分布检验的已知变异检出方法和装置。该方法包括:提供测序读长碱基序列、参考基因组序列和假设已知变异位点存在时推算出的测序读长序列;将所述假设已知变异位点存在时推算出的测序读长序列与所述测序读长碱基序列进行比对检测;进行贝叶斯检验模型和泊松分布检验模型的判断。本发明的方法能够高特异性、高敏感性地实现SNV或InDel变异检出。

技术领域

本发明涉及核苷酸序列的变异位点检测技术领域,尤其涉及一种基于贝叶斯与泊松分布检验的已知变异检出方法和装置。

背景技术

在科研及临床转化领域的技术中,对于体细胞基因突变的检测方法主要有PCR-Sanger法、PCR-Mass法、ARMS-PCR法和高通量捕获测序法等。这几种方法的样本均来源于癌症患者手术时所切除的病灶组织样本。PCR-Sanger测序法的灵敏度低,仅能检测突变率大于20%的高频突变,且难以胜任多基因多位点的检测;PCR-Mass法不能检测位置突变,也不能检测插入删除变异(InDel),灵敏度在5%左右,该技术局限性较大;ARMS-PCR法特异性好,灵敏度高,能检测1%-5%的低频突变,然而该方法只能检测特定的已知突变,且不能同时检测多个基因多个位点。

BGISEQ-100平台的数据特点,导致传统的变异检出软件(如SOAPsnp、VarScan、GATK等)的检出效果不理想。BGISEQ-100平台数据在InDel附近的碱基比对质量会下降,尤其对EGFR基因c.2238_2248GC这类常见的复杂变异,删除后插入的GC碱基可能会比对到不同的位置,无法正确比对到参考基因组,从而导致传统变异检出软件的检测效果不理想。

发明内容

本发明提供一种基于贝叶斯与泊松分布检验的已知变异检出方法和装置,能够高特异性、高敏感性地实现SNV或InDel变异检出。

根据本发明的第一方面,本发明提供一种基于贝叶斯与泊松分布检验的已知变异检出方法,包括:提供测序读长碱基序列、参考基因组序列和假设已知变异位点存在时推算出的测序读长序列;将上述假设已知变异位点存在时推算出的测序读长序列与上述测序读长碱基序列进行比对检测,找到每一位点变异发生时的变异特征并找到能覆盖到该位点的所有测序读长碱基序列;针对上述变异特征对应的每一位点,在贝叶斯检验模型下,假设模型M0代表该位点不存在变异,与上述参考基因组序列不同的碱基是系统误差,假设模型代表该位点由上述参考基因组碱基r变异为m真实存在,并且等位基因突变频率为f,对于既不为r也不为m的碱基当作系统误差,判断上述模型的概率与模型M0的概率之比值与第一阈值的关系;针对上述变异特征对应的每一位点,在泊松分布检验模型下,假设当测序深度一定时已知变异位点发生测序错误的读长条数为λ,假设带有已知变异特征的读长是由测序错误导致的且读长条数为n,判断n服从参数为λ的泊松分布累计概率值与第二阈值的关系;若上述模型的概率与模型M0的概率之比值大于等于上述第一阈值,且上述泊松分布累计概率值大于上述第二阈值,判断该位点为强阳性变异;若上述模型的概率与模型M0的概率之比值大于等于上述第一阈值,或上述泊松分布累计概率值大于上述第二阈值,判断该位点为弱阳性变异;若上述模型的概率与模型M0的概率之比值小于上述第一阈值,且上述泊松分布累计概率值小于等于上述第二阈值,判断该位点为阴性无变异。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州华大基因医学检验所有限公司;广州华大基因科技有限公司,未经广州华大基因医学检验所有限公司;广州华大基因科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201610407552.3/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top