[发明专利]基于贝叶斯与泊松分布检验的已知变异检出方法和装置有效
申请号: | 201610407552.3 | 申请日: | 2016-06-08 |
公开(公告)号: | CN107480470B | 公开(公告)日: | 2020-08-11 |
发明(设计)人: | 刘继龙;刘足;程少敏;郭凤明;李世勇 | 申请(专利权)人: | 广州华大基因医学检验所有限公司;广州华大基因科技有限公司 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G16B20/50 |
代理公司: | 深圳鼎合诚知识产权代理有限公司 44281 | 代理人: | 孙银行;彭家恩 |
地址: | 510006 广东省广州市番禺区大学城小谷围*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于贝叶斯与泊松分布检验的已知变异检出方法和装置。该方法包括:提供测序读长碱基序列、参考基因组序列和假设已知变异位点存在时推算出的测序读长序列;将所述假设已知变异位点存在时推算出的测序读长序列与所述测序读长碱基序列进行比对检测;进行贝叶斯检验模型和泊松分布检验模型的判断。本发明的方法能够高特异性、高敏感性地实现SNV或InDel变异检出。 | ||
搜索关键词: | 基于 贝叶斯 分布 检验 已知 变异 检出 方法 装置 | ||
【主权项】:
一种基于贝叶斯与泊松分布检验的已知变异检出方法,其特征在于,所述方法包括:提供测序读长碱基序列、参考基因组序列和假设已知变异位点存在时推算出的测序读长序列;将所述假设已知变异位点存在时推算出的测序读长序列与所述测序读长碱基序列进行比对检测,找到每一位点变异发生时的变异特征并找到能覆盖到该位点的所有测序读长碱基序列;针对所述变异特征对应的每一位点,在贝叶斯检验模型下,假设模型M0代表该位点不存在变异,与所述参考基因组序列不同的碱基是系统误差,假设模型代表该位点由所述参考基因组碱基r变异为m真实存在,并且等位基因突变频率为f,对于既不为r也不为m的碱基当作系统误差,判断所述模型的概率与模型M0的概率之比值与第一阈值的关系;针对所述变异特征对应的每一位点,在泊松分布检验模型下,假设当测序深度一定时已知变异位点发生测序错误的读长条数为λ,假设带有已知变异特征的读长是由测序错误导致的且读长条数为n,判断n服从参数为λ的泊松分布累计概率值与第二阈值的关系;若所述模型的概率与模型M0的概率之比值大于等于所述第一阈值,且所述泊松分布累计概率值大于所述第二阈值,判断该位点为强阳性变异;若所述模型的概率与模型M0的概率之比值大于等于所述第一阈值,或所述泊松分布累计概率值大于所述第二阈值,判断该位点为弱阳性变异;若所述模型的概率与模型M0的概率之比值小于所述第一阈值,且所述泊松分布累计概率值小于等于所述第二阈值,判断该位点为阴性无变异。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州华大基因医学检验所有限公司;广州华大基因科技有限公司,未经广州华大基因医学检验所有限公司;广州华大基因科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610407552.3/,转载请声明来源钻瓜专利网。