[发明专利]核酸测序数据的质量评估方法和筛选方法在审

专利信息
申请号: 202210104023.1 申请日: 2022-01-28
公开(公告)号: CN114420214A 公开(公告)日: 2022-04-29
发明(设计)人: 周文雄;黄家蔚;司二玲;陈子天;吴思彧 申请(专利权)人: 赛纳生物科技(北京)有限公司
主分类号: G16B30/10 分类号: G16B30/10
代理公司: 北京嘉途睿知识产权代理事务所(普通合伙) 11793 代理人: 李鹏
地址: 100176 北京市大兴*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 核酸 序数 质量 评估 方法 筛选
【说明书】:

本发明提供一种核酸测序数据的质量评估方法和筛选方法,利用测序信号和校正后的信号之间的差异,来评估碱基测序质量或者来筛选核酸测序数据,尤其是利用失相校正后的信号和纠错校正后的信号之间的差异,这是首个专门适用于纠错码测序的质量评估方法和筛选方法,本发明的方法还适用于其他测序方法所得测序数据,适用范围广。

技术领域

本发明涉及核酸测序数据的质量评估方法和筛选方法,属于基因测序领域。

背景技术

高通量测序是一种同时对成千上万条DNA序列进行序列测定的技术,被广泛应用于基础生物学和医学研究、以及体外诊断。通常,高通量测序仪除了输出所测DNA序列之外,还会给输出的每一个碱基一个质量值,以表征该碱基的测量准确度。通常,这个质量值以Phred的形式给出,即当该碱基的测量准确度为D时,所给质量值为:

q=-10 log10(1-p)

例如,质量值10对应准确度90%,质量值20对应准确度99%,质量值30对应准确度99.9%。

目前,高通量测序领域普遍使用的质量值评估方法为Phred算法(Ewing B,GreenP.Base-calling of automated sequencer traces using Phred.II.Errorprobabilities.Genome Res.8:186-194(1998))。Phred算法被普遍应用于DNA测序领域中,但不同测序技术所使用的预测器不同。例如,IonTorrent使用的预测器有:碱基在序列中的位置;碱基所处同源多聚物的长度;碱基所处测序信号接近整数的程度;碱基所处测序信号的失相程度等。Illumina也公开了一种使用神经网络的质量评估方法,即训练一个神经网络,通过预测器的值来预测碱基的质量,Illumina的质量预测器值包括在线重叠、纯度、定相、start5、六聚体得分、基序累积、端值(endiness)、近似均聚物、强度衰减、倒数第二纯化度、与背景的信号重叠(SOWB)和/或偏移的纯度G调整等(专利CN202080005431.0)。

一个好的打分算法,应当具有较高的区分度,即能够把高质量的碱基筛选出来,并给它打高分,把低质量的碱基筛选出来,并打低分。而利用现有算法对纠错码测序的测序数据进行质量评估时,存在区分度不足/较低的问题。因此,需要开发一种适用于纠错码测序数据且具有更高区分度的碱基质量评估方法。

高通量测序仪一次运行可产生大量的数据。然而,由于光学成像、信号采集、DNA扩增产生的多克隆、化学反应、机械系统、算法处理等方面的缺陷及噪音的干扰,并非所有产生的数据均为高质量的数据。若下机后提供给用户的数据中包含低质量的、不可信的测序数据,则可能影响用户对样品的分析,造成假阳性或假阴性等误判,严重的可能影响临床诊断结果,延误病情。因此,对测序数据进行筛选、保留并输出高质量测序数据是高通量测序的必要步骤。

Illumina采用“纯净度”来筛选其测序数据(美国专利US13006206)。具体地,Illumina给四种碱基分别标记不同的荧光,测序时荧光最强的碱基即为所测碱基,其纯净度被定义为四种荧光中最强的荧光强度除以四种荧光强度之和,并认为纯净度高于给定阈值的序列为高质量序列。Ion torrent利用两个指标来筛选其测序数据:SSQ(校正信号与其取整值间的欧氏距离)和PPF(非零信号的比例)(专利EP19181402,WOUS11067959),认为这两个指标均小于给定阈值的序列为高质量序列。

在实际应用中,普遍利用高通量测序仪给所测DNA序列的碱基打的质量值来筛选测序数据。例如fastp软件会对每条序列的质量值作移动平均,并在均值较低处对序列进行切除。也就是说筛选过程必须在得到碱基对应的质量值之后进行,增加了等待时间,有需要开发一种不依赖于碱基测序质量值的测序数据筛选方法。

发明内容

一方面,本发明提供一种核酸测序数据的质量评估方法,其特征在于,包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于赛纳生物科技(北京)有限公司,未经赛纳生物科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210104023.1/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top