[发明专利]使用K聚体在没有比对的情况下进行测序数据的快速质量控制在审
申请号: | 201880079257.7 | 申请日: | 2018-11-07 |
公开(公告)号: | CN111492436A | 公开(公告)日: | 2020-08-04 |
发明(设计)人: | 吴捷;Y·H·张 | 申请(专利权)人: | 皇家飞利浦有限公司 |
主分类号: | G16B30/10 | 分类号: | G16B30/10 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 孟杰雄 |
地址: | 荷兰艾*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 没有 情况 进行 序数 快速 质量 控制 | ||
一种用于使用质量控制分析系统(300)来评价核酸测序数据的方法(200),包括:接收(210)核酸序列的多个读取;从多个读取中提取(220)多个k聚体;使用多个提取的k聚体来识别(230)在所述多个读取中发现的多个被注释的k聚体中的一个或多个,其中,多个提取的k聚体被存储在注释数据库中(350),并且此外,其中,被注释的k聚体利用关于从其生成被注释的k聚体的一个或多个核酸序列的注释信息来注释;基于在多个读取中发现的所识别的被注释的k聚体来收集(240)关于多个读取的注释信息;并且基于所收集的注释信息来确定(250)针对多个读取中的至少一些读取的质量控制度量。
技术领域
本公开总体上涉及用于测序数据的质量控制分析的方法和系统。
背景技术
下一代测序(NGS)是用于基因组学研究的重要工具,并且具有针对发现、诊断和其他方法学的许多应用。结果,每分钟在全世界生成数十亿次NGS读取。
NGS数据的质量控制分析是任何下游分析之前要求的关键的第一步骤。在后续分析之前适当评估NGS数据的质量可以减少或防止错误解释数据、误诊和其他非期望下游效应。
建立了用于NGS数据的质量控制分析的度量。通常,这些分析是在将读取与基因组比对之前或之后执行的。例如,如FASTQC的工具被用于查看诸如fastq文件的原始测序数据,并且通常报告诸如碱基质量、GC含量、序列复制水平和潜在的衔接子含量的信息。可以在不知道读取相对于被测序的核酸的位置的情况下导出这些度量。存在不能够直接从读取序列中提取的高级质量控制度量,诸如映射率、rRNA读取百分比、读取分布(包括外显子、内含子、基因间等),5'/3'偏倚和检测到的转录本数量。因此,有必要将读取与基因组参考比对,并且然后通过诸如RNA-SeQC的程序分析比对的读取以提取这些质量控制度量。
然而,将所获得的读取与基因组参考比对是耗时的过程,其能够花费数小时。作为结果,这些高级质量控制度量仅能够在已经生成读取后很长时间获得。在生成读取和获得质量控制信息之间的该显著时间延迟阻止纠正措施,并且能够导致低效率和增加的成本。
发明内容
持续需要测序数据的实时或接近实时的质量控制分析。
本公开涉及用于在没有与基因组参考比对的情况下对测序数据进行质量控制分析的发明方法和系统。本文的各种实施例和实施方式涉及一种系统,其中,来自一个或多个基因组参考的多个k聚体在数据库中用关于k聚体的信息(例如种类、位置和其他可能的信息)注释。从测序期间生成的读取中提取K聚体,并将这些提取的k聚体用于在质量控制分析中查找匹配的被注释的k聚体。与数据库中与提取的k聚体匹配的k聚体关联的注释提供了关于读取的种类的信息、读取的最可能来源和/或关于读取的其他信息。可以对注释信息进行整理和汇总,以为整个数据集提供一个或多个质量控制度量。
通常,在一个方面中,提供了一种用于使用质量控制分析系统评估核酸测序数据的方法。所述方法包括:(i)由所述质量控制分析系统接收核酸序列的多个读取;(ii)由所述质量控制分析系统的处理器从所述多个读取中提取多个k聚体;(iii)使用多个提取的k聚体来识别在所述多个读取中发现的多个被注释的k聚体中的一个或多个,其中,所述多个被注释的k聚体是根据一个或多个核酸序列生成的并且被存储在所述质量控制分析系统的注释数据库中,并且此外,其中,利用关于所述一个或多个核酸序列的注释信息来注释所述被注释的k聚体,所述被注释的k聚体是根据所述一个或多个核酸序列生成的;(iv)基于在所述多个读取中发现的所识别的被注释的k聚体来收集关于所述多个读取的注释信息;并且(v)基于所收集的注释信息来确定针对所述多个读取中的至少一些读取的质量控制度量。
根据实施例,所述方法还包括报告所确定的质量控制度量的步骤。
根据实施例,所述方法还包括响应于所确定的质量控制度量的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于皇家飞利浦有限公司,未经皇家飞利浦有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880079257.7/2.html,转载请声明来源钻瓜专利网。