[发明专利]核酸测序数据的质量评估方法和筛选方法在审
申请号: | 202210104023.1 | 申请日: | 2022-01-28 |
公开(公告)号: | CN114420214A | 公开(公告)日: | 2022-04-29 |
发明(设计)人: | 周文雄;黄家蔚;司二玲;陈子天;吴思彧 | 申请(专利权)人: | 赛纳生物科技(北京)有限公司 |
主分类号: | G16B30/10 | 分类号: | G16B30/10 |
代理公司: | 北京嘉途睿知识产权代理事务所(普通合伙) 11793 | 代理人: | 李鹏 |
地址: | 100176 北京市大兴*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 核酸 序数 质量 评估 方法 筛选 | ||
1.一种核酸测序数据的质量评估方法,其特征在于,包括:
a)对参考核酸样品进行测序,获得一组测序信号s;用相同的测序方法对待测核酸样品进行测序,获得一组测序信号s’;
b)对所述测序信号s进行信号校正,获得校正信号c,所述校正信号c可直接转换成碱基序列;
c)将转换出的碱基序列比对到参考序列上,得到比对结果,再根据所述比对结果将碱基标记为测序正确或测序错误;
d)对所述测序正确或测序错误的碱基,比较其在测序信号s和校正序列c中对应部分的信号差异,并建立信号差异和碱基测序准确率之间的联系;
e)用与步骤b)相同的校正方式对所述测序信号s’进行信号校正,获得校正信号c’,再将c’转换成碱基序列;
f)对转换出的碱基序列中的每个碱基,比较其在s’和c’中对应部分的信号差异,利用步骤d)中建立的信号差异和碱基准确率之间的联系,预测该碱基的测序准确率。
2.一种核酸测序数据的筛选方法,其特征在于,包括:
a)对待测核酸样品进行测序,获得一组测序信号;
b)对所述测序信号进行信号校正,获得校正信号,所述校正信号可直接转换为碱基序列;
c)对转换出的碱基序列,比较其在测序信号和校正信号中对应部分的信号差异;
d)若测序信号和校正信号之间的所述信号差异大于给定的阈值,则丢弃该测序信号,否则予以保留。
3.根据权利要求1所述的方法,其特征在于,所述参考核酸样品所属物种的基因组序列已知;所述参考核酸是DNA时,所述参考序列为参考核酸所属物种的基因组序列;所述参考核酸是RNA时,所述参考序列为参考核酸所属物种的转录组序列。
4.根据权利要求1所述的方法,其特征在于,将转换出的碱基序列比对到参考序列上,得到比对结果,从中进一步筛选出高质量比对的碱基序列,再将所述高质量比对的碱基序列中的碱基标记为测序正确或测序错误。
5.根据权利要求1或2所述的方法,其特征在于,所述测序信号是测序仪直接采集到的信号,或者是经过归一化后的信号;相对应地,对测序信号的校正过程,可以是失相校正,所述校正信号是失相校正后的信号。
6.根据权利要求1或2所述的方法,其特征在于,在纠错码测序或采用了精准化学读出的SOLiD等测序技术中,所述测序信号可以是失相校正后的信号;相对应地,对测序信号的校正过程,可以是纠错校正过程,所述校正信号是纠错校正后的信号。
7.根据权利要求1或2所述的方法,其特征在于,在采用环形一致性测序模式的单分子实时测序中,或利用DNA复制、反复多次测序来提高准确度的纳米孔测序技术中,所述测序信号可以是原始序列;相对应地,对测序信号的校正过程,可以是求一致性序列的过程。
8.根据权利要求1所述的方法,其特征在于,所述建立信号差异和碱基准确率之间联系的方法,是构建信号差异和碱基准确率之间的对照表。
9.根据权利要求1所述的方法,其特征在于,所述建立信号差异和碱基准确率之间联系的方法,是将一个或多个预测器划分成若干个区间,统计每个区间内碱基的准确率及准确率对应的质量值;评估的方法是计算所测核酸中的每个碱基落入哪个预测器的区间,再将该区间对应的质量值赋给该碱基。
10.根据权利要求1所述的方法,其特征在于,所述建立信号差异和碱基准确率之间联系的方法及对应的评估方法,是Phred算法。
11.根据权利要求1所述的方法,其特征在于,所述建立信号差异和碱基准确率之间联系的方法,是机器学习。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于赛纳生物科技(北京)有限公司,未经赛纳生物科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210104023.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:义齿浸染装置
- 下一篇:一种人造革生产纠偏装置