[发明专利]使用K聚体在没有比对的情况下进行测序数据的快速质量控制在审
申请号: | 201880079257.7 | 申请日: | 2018-11-07 |
公开(公告)号: | CN111492436A | 公开(公告)日: | 2020-08-04 |
发明(设计)人: | 吴捷;Y·H·张 | 申请(专利权)人: | 皇家飞利浦有限公司 |
主分类号: | G16B30/10 | 分类号: | G16B30/10 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 孟杰雄 |
地址: | 荷兰艾*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 没有 情况 进行 序数 快速 质量 控制 | ||
1.一种用于使用质量控制分析系统(300)来评价核酸测序数据的方法(200),包括:
由所述质量控制分析系统接收(210)核酸序列的多个读取;
由所述质量控制分析系统的处理器(320)从所述多个读取中提取(220)多个k聚体;
使用多个提取的k聚体来识别(230)在所述多个读取中发现的多个被注释的k聚体中的一个或多个,其中,所述多个被注释的k聚体是根据一个或多个核酸序列生成的并且被存储在所述质量控制分析系统的注释数据库(350)中,并且此外,其中,利用关于所述一个或多个核酸序列的注释信息来注释所述被注释的k聚体,所述被注释的k聚体是根据所述一个或多个核酸序列生成的;
基于在所述多个读取中发现的所识别的被注释的k聚体来收集(240)关于所述多个读取的注释信息;并且
基于所收集的注释信息来确定(250)针对所述多个读取中的至少一些读取的质量控制度量。
2.根据权利要求1所述的方法,还包括报告(260)所确定的质量控制度量的步骤。
3.根据权利要求1所述的方法,还包括对所确定的质量控制度量进行响应(270)的步骤。
4.根据权利要求1所述的方法,还包括以下步骤:
根据核酸序列来生成(120)所述多个被注释的k聚体;
将所生成的多个k聚体存储(130)在所述注释数据库中;并且
利用注释信息来注释(140)所存储的多个k聚体中的一个或多个。
5.根据权利要求4所述的方法,其中,所述注释信息包括关于所述被注释的k聚体在所述核酸序列内的位置的信息。
6.根据权利要求4所述的方法,其中,所述注释信息包括关于所述核酸序列的特性的信息,所述被注释的k聚体是根据所述核酸序列生成的。
7.根据权利要求1所述的方法,其中,所述质量控制度量是对所述读取的污染的测量结果、所述多个读取的深度或覆盖度和/或对所述多个读取从其被生成的一个或多个种类的识别。
8.根据权利要求1所述的方法,其中,所述质量控制度量是在接收到的读取与基因组序列的比对之前确定的。
9.一种被配置为评价核酸测序数据的系统(300),包括:
注释数据库(350),其包括根据一个或多个核酸序列生成的多个被注释的k聚体,其中,利用关于所述一个或多个核酸序列的注释信息来注释所述多个被注释的k聚体,所述被注释的k聚体是根据所述一个或多个核酸序列生成的;以及
处理器(320),其包括:
k聚体提取器(360),其被配置为从核酸序列的多个读取中提取多个k聚体;
k聚体分析器(370),其被配置为:(i)使用多个提取的k聚体来识别所述注释数据库中的在所述多个读取中发现的所述多个被注释的k聚体中的一个或多个;(ii)基于在所述多个读取中发现的所识别的被注释的k聚体来收集关于所述多个读取的注释信息;(iii)基于所收集的注释信息来确定针对所述多个读取中的至少一些读取的质量控制度量。
10.根据权利要求9所述的系统,还包括注释器(340),所述注释器被配置为:(i)根据所述一个或多个核酸序列来生成所述多个被注释的k聚体;(ii)将所生成的多个k聚体存储在所述注释数据库中;并且(iii)利用注释信息来注释所存储的多个k聚体中的一个或多个。
11.根据权利要求9所述的系统,其中,所述处理器被配置为对所确定的质量控制度量进行响应。
12.根据权利要求9所述的系统,还包括用户接口(310),所述用户接口被配置为向用户提供所确定的质量控制度量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于皇家飞利浦有限公司,未经皇家飞利浦有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880079257.7/1.html,转载请声明来源钻瓜专利网。