[发明专利]用于分析核酸的系统和方法在审
申请号: | 201780010411.0 | 申请日: | 2017-02-09 |
公开(公告)号: | CN108885648A | 公开(公告)日: | 2018-11-23 |
发明(设计)人: | F·M·德拉维加 | 申请(专利权)人: | 托马生物科学公司 |
主分类号: | G06F19/22 | 分类号: | G06F19/22;C40B60/10;H01L27/118;H01L21/768 |
代理公司: | 北京同恒源知识产权代理有限公司 11275 | 代理人: | 王维绮 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 变体 体细胞 测序数据 概率建模 计算分析 软件介质 序列变体 医疗保健 分析 试剂盒 核酸 突变 推断 样本 统计 网络 | ||
本发明提供了用于对来自个体的样本的测序数据进行计算分析的系统、软件介质、网络、试剂盒和方法。分析可以提取种系和体细胞信息并比较两种类型的信息,以基于概率建模和统计推断来识别序列变体。分析可以包括区分种系变体(例如,私有变体(private variant))和体细胞突变。识别的变体可供临床使用以提供更好的医疗保健。
本申请要求申请日为2016年2月9日的美国专利申请序列号62/293,136的优先权,该专利申请在此以其全文形式被援引加入本文。
背景技术
从组织样本的高通量测序数据中准确识别癌症体细胞突变可能是具挑战性的和未解的难题。测序数据可用于临床过程,用于具有未知分析率的假阳性或阴性变体的治疗选择。在这个过程中可能面对的问题包括:鉴于根据样本的大范围不同比例的存在正常细胞的组织样本的异质性(例如,原发肿瘤vs.血浆中的无细胞DNA(cf-DNA)),不同比例的多个癌细胞克隆的存在,来自“正常”组织的样本的能够区分体细胞和种系变体的数据的缺乏,由于病理学处理(例如,福尔马林固定和石蜡包埋(FFPE))对样本中的DNA造成的损害,以及结构变异与简单序列变体的卷积。新的分析方法可以改进从大规模测序数据中识别种系变体。
在一些情况,当将分析中的数据与单个对照样本进行比较时,癌症数据分析可能产生不一致的结果。在一些情况,数据分析依赖于来自患者的正常组织的数据的可用性,所述数据以与含有或怀疑含有癌细胞的样本相似的方式进行处理,其通常在癌症病理学用例中不可用。目前包括人工或启发式方法以从体细胞突变中过滤出种系变体的分析管道(analysis pipeline)可能是任意的、不精确的、难以再现的,并且不提供关于在该过程中默认作出的假阳性和假阴性之间的权衡的信息。不过,当正常组织可用时,在一些情况它被独立分析,并且仅在对“真实”种系变体做出决定后作为过滤步骤被汇集在一起,这可能由于种系变体错过了种系识别所施加的阈值而导致假阳性体细胞突变。处理后期问题的解决方案可以是使用正常样本组作为群体中常见的参考种系变体。为了进一步处理患者中存在的罕见变体,包括癌症易感性变体,本发明披露了新的方法。所述方法可以基于同时对从患者以及一组其他先前分析的患者中获得的所有样本的比对的测序数据中的变体进行识别和评分。
发明内容
本发明提供了用于从组织的高通量测序数据中识别癌症体细胞突变的系统、软件介质、网络和方法。
在一个方面,本发明公开了一种计算系统,包括:(a)处理器,以及被设置成执行机器可读指令的存储器模块;和(b)数据分析应用程序,所述数据分析应用程序包括:(1)数据接收模块,所述数据接收模块被设置成从个体的一个或多个样本接收核酸分子的测序片段,其中测序片段由高通量测序仪产生;(2)序列比对模块,所述序列比对模块被设置成将测序片段相对于参考组装进行比对以产生预测的基因组序列;和(3)基因组分析模块,所述基因组分析模块被设置成(i)通过联合和同时分析预测的基因组序列来识别推定的变体,和(ii)通过为体细胞突变或种系变体的概率对推定的变体进行评分。
在另一方面,本发明公开了一种编码有计算机程序的计算机可读存储介质,所述计算机程序包括通过处理器可执行的指令以创建数据分析应用程序,所述应用程序包括:(a)数据接收模块,所述数据接收模块被设置成从个体的一个或多个样本接收核酸分子的测序片段,其中测序片段由高通量测序仪产生;(b)序列比对模块,所述序列比对模块被设置成将测序片段相对于参考组装进行比对以产生预测的基因组序列;和(c)基因组分析模块,所述基因组分析模块被设置成(i)通过联合和同时分析预测的基因组序列来识别推定的变体,和(ii)通过为体细胞突变或种系变体的概率对推定的变体进行评分。
在另一方面,公开了一种方法,包括:(a)采集个体的一个或多个样本;(b)利用高通量测序仪对一个或多个样本的核酸分子进行测序并产生测序片段;(c)将测序片段与参考组装进行比对以产生预测的基因组序列;(d)通过联合和同时分析预测的基因组序列来识别推定的变体;以及(e)通过为体细胞突变或种系变体的概率对推定的变体进行评分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于托马生物科学公司,未经托马生物科学公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780010411.0/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用