[发明专利]用于计算经校正扩增子覆盖度的方法、系统及计算机可读媒体有效
申请号: | 201580054718.1 | 申请日: | 2015-10-09 |
公开(公告)号: | CN107111692B | 公开(公告)日: | 2021-10-29 |
发明(设计)人: | J·维奇;展逸屏 | 申请(专利权)人: | 生命科技股份有限公司 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G16B25/00;G16B30/10 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 张欣 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 计算 校正 扩增 覆盖 方法 系统 计算机 可读 媒体 | ||
1.一种用于基于经校正扩增子覆盖度来识别拷贝数变异的计算机实施的方法,所述方法包括:
针对多个训练样品中的每个训练样品,获取多个训练读段,其中所述多个训练样品包括具有已知倍性的正常样品,其中所述多个训练样品中的一些样品是在多个批次中与所述多个训练样品中的其他样品不同的批次中制备的;
针对所述多个训练样品中的每个训练样品,将所述多个训练读段映射到对应于所述训练样品的扩增子的核酸参考序列;
针对所述多个训练样品中的每个训练样品,计算所述训练样品的扩增子覆盖度和总读段,其中扩增子覆盖度为经映射到扩增子的多个读段,且所述总读段为多个经映射读段;
通过将主成分分析应用于针对所述训练样品计算的所述扩增子覆盖度来确定分批效果的值,其中每个主成分代表一个分批效果的值的向量;
获取基于疑具有一或多个遗传畸变的测试样品的经扩增靶区域的多个扩增子的多个读段;
将所述多个读段映射到参考序列,所述参考序列包含对应于所述经扩增靶区域的一或多个核酸序列;
计算所述测试样品的扩增子覆盖度及总读段;
经由基于所述计算出的扩增子覆盖度、所计算出的总读段、所述测试样品的样品依赖性倍率及针对所述训练样品确定的所述分批效果值应用分批效果校正来计算经校正扩增子覆盖度;及
基于所述经校正扩增子覆盖度的倍性状态的似然性识别所述测试样品的所述拷贝数变异。
2.根据权利要求1所述的方法,其进一步包括:
将与疑具有一或多个遗传畸变的所述测试样品隔离的核酸的所述靶区域扩增;
基于所述经扩增靶区域产生所述多个扩增子;及
测序所述多个扩增子以获得所述多个读段。
3.根据权利要求2所述的方法,其中将与疑具有一或多个遗传畸变的所述测试样品隔离的核酸的所述靶区域扩增包含多重扩增。
4.根据权利要求1所述的方法,其进一步包括:
基于针对倍性状态范围计算出的所述似然性确定所述多个扩增子的最大分数路径;及
基于所述最大分数路径识别所述拷贝数变异。
5.根据权利要求4所述的方法,其进一步包括:
基于所述总读段在计算所述最大分数路径的似然性之前将所述经校正扩增子覆盖度归一化。
6.根据权利要求1所述的方法,其进一步包括:
基于针对所述测试样品计算的所述扩增子覆盖度和总读段以及使用所述主成分分析针对训练样品确定的分批效果值的对数,估计所述测试样品的样品依赖性倍率。
7.根据权利要求1所述的方法,其中计算经校正扩增子覆盖度的步骤还包括基于所述样品依赖性倍率与针对第i个扩增子确定的分批效果值的对数的乘积,确定所述第i个扩增子的经校正拷贝数的对数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于生命科技股份有限公司,未经生命科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201580054718.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:水晶工艺品(4)
- 下一篇:一种园林用多功能展示装置