[发明专利]一种检测细胞游离肿瘤基因拷贝数变异的系统和方法有效
申请号: | 201810657872.3 | 申请日: | 2018-06-22 |
公开(公告)号: | CN108875302B | 公开(公告)日: | 2022-02-22 |
发明(设计)人: | 方鹏;车健为 | 申请(专利权)人: | 广州漫瑞生物信息技术有限公司 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G16B30/10;G16B40/00 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 宋静娜;郝传鑫 |
地址: | 510000 广东省广州市高新技术产业开发区科学城*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种检测细胞游离肿瘤基因拷贝数变异的系统和方法,本发明通过采用整体捕获区域的平均测序深度对每一个捕获区间的平均深度进行归一化处理,消除因实验操作误差造成的捕获效率的变化对基因拷贝数鉴定的影响。而传统的归一化方法采用的是区间reads数与所有测序reads数的比值作为每一区间的归一化值,传统方法没能消除不同实验间捕获效率不一致对结果的影响。本发明通过构建正常训练集的方法,能够消除样本内每个捕获区间之间因GC含量、探针浓度等原因造成的各个区间之间的捕获效率不一致的问题,降低假阳性率。 | ||
搜索关键词: | 一种 检测 细胞 游离 肿瘤 基因 拷贝 变异 系统 方法 | ||
【主权项】:
1.一种检测细胞游离肿瘤基因拷贝数变异的系统,其特征在于,包括:比对模块,用于将K个正常人样本测序得到的DNA序列比对到人类参考基因组,得到DNA序列在基因组上的位置信息;用于将待检测样本测序得到的DNA序列比对到人类参考基因组,得到DNA序列在基因组上的位置信息;计算模块,用于计算每个正常人样本捕获区间的平均测序深度Xi,其中i=1,2,3,...,K;计算每个正常人样本的N个连续捕获区间的平均测序深度xij,其中i=1,2,3,...,K;j=1,2,3,...,N;并对正常人样本i的各个捕获区间采用该样本总体的平均深度Xi进行归一化处理,得到Aij=xij/Xi,其中i=1,2,3,...,K;j=1,2,3,...,N;对每个捕获区间Aij采用Z‑score方法进行异常值的剔除,|Z‑score|>3则表示异常;计算正常人样本每个捕获区间的基线值Cj=mean(Aij)和标准差σj=sd(Aij)其中i=1,2,3,...,K;j=1,2,3,...,N;mean和sd分别表示计算平均值和标准差的方法;计算待检测样本捕获区间的平均测序深度X;计算待检测样本的N个连续捕获区间的平均测序深度xj,其中j=1,2,3,...,N,并对待检测样本的各个捕获区间采用该样本总体的平均深度X进行归一化处理,得到Tj=xj/X,其中j=1,2,3,...,N;计算待检测样本每个捕获区间的基因拷贝数:Nj=2*Tj/Cj,其中j=1,2,3,...,N;计算待检测样本每个捕获区间的基因拷贝数与正常人相应区间基因拷贝数差异显著性检验p‑value值:Pj=2*pnorm(‑1*|(Tj‑Cj)/σj|),其中j=1,2,3,...,N,pnorm为正太分布函数;输出模块,用于输出待检测样本的各个捕获区间的基因组位置信息、基因信息、基因拷贝数、p‑value值以及待检测样本的各个捕获区间是否发生基因拷贝数变异的结果,当满足以下两个条件时:1)Nj>2+1.96σj或者Nj<2‑1.96σj;2)Pj<6.33e‑05,则认为该捕获区间发生了基因拷贝数变异。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州漫瑞生物信息技术有限公司,未经广州漫瑞生物信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810657872.3/,转载请声明来源钻瓜专利网。