[发明专利]一种甲基化测序数据过滤方法及应用在审
| 申请号: | 202210101807.9 | 申请日: | 2022-01-27 |
| 公开(公告)号: | CN114496096A | 公开(公告)日: | 2022-05-13 |
| 发明(设计)人: | 张翼;陈昕彤 | 申请(专利权)人: | 安康优乐复生科技有限责任公司 |
| 主分类号: | G16B40/00 | 分类号: | G16B40/00;G16B20/00 |
| 代理公司: | 北京林达刘知识产权代理事务所(普通合伙) 11277 | 代理人: | 刘新宇;李茂家 |
| 地址: | 725000 陕西省安康市*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 甲基化 序数 过滤 方法 应用 | ||
本发明属于生物技术领域,具体涉及一种甲基化测序数据过滤方法及应用。本发明提供的甲基化测序数据过滤方法能够将亚硫酸氢盐处理过的DNA中,未发生甲基化的C碱基转化为U碱基的转化效率,从98.81%提高到99.44%。在此基础上,应用本申请的数据过滤方法可以准确评估序列的甲基化水平并获得质量过关、准确率和可信度高的甲基化单倍型。实验数据显示,使用通过本发明提供的甲基化测序数据过滤方法得到的甲基化单倍型,能够很好的区分膀胱尿路上皮癌患者与正常人的尿液样本(AUC=0.94)以及肌层浸润性膀胱尿路上皮癌与非肌层浸润性膀胱尿路上皮癌患者的尿液样本(AUC=0.967)。
技术领域
本发明属于生物技术领域,具体涉及一种甲基化测序数据过滤方法及应用。
背景技术
DNA甲基化是一种重要的表观遗传修饰,它与许多生物调控途径相关,目前存在多种碱基层面分辨率的甲基化定量方法,本发明采用的是亚硫酸盐测序(Bisulfitesequencing,BS-seq,methseq)。
亚硫酸氢盐处理过的DNA中,未发生甲基化的C碱基会被转化为U碱基,且转化效率能达到99%左右,通过高通量测序方法可精确地测量单碱基水平的甲基化修饰。经过亚硫酸氢盐转化的DNA,通过PCR反应扩增后,U碱基转变成T,而甲基化的C保持不变,因此通过序列每个位置的碱基信息就能得到甲基化修饰的具体碱基位置。计算机软件确定测序仪测得的碱基及顺序,获得序列片段(read/fragment),输出FASTQ格式数据记录读段序列及测序质量分数。
在常规的分析中,亚硫酸氢盐测序数据可能出现的错误包含两种情况:(1)未甲基化的位点经过处理后,没有成功地将C碱基变成T碱基;(2)本应该维持不变的甲基化位点的C碱基却发生了变化。然而目前没有更好的实验手段用来避免亚硫酸氢盐处理DNA过程中出现的错误。
发明内容
发明要解决的问题
本发明提供了一种甲基化测序数据过滤方法,用以提高亚硫酸氢盐处理DNA时将未发生甲基化的C碱基转化为U碱基的转化效率,同时本发明提供了该甲基化测序数据过滤方法在癌症检测中的应用,用以创建灵敏度高、特异性好癌症预测模型。
用于解决问题的方案
[1].一种用于过滤甲基化测序数据的设备,其包括:
处理器;
用于存储执行指令的存储器;
其中,所述处理器执行指令时,实现甲基化测序数据的过滤方法,所述方法包括下列步骤:
i)截取引物合成时插入区域上的测序序列;
ii)按以下条件过滤测序片段,以获得符合条件的测序片段的甲基化单倍型:
a.去除C和G碱基转化频率都小于0.9的片段;b.去除C和G碱基转化频率都大于0.5的片段;c.去除被视为错误的序列;d.保留C碱基转化率小于0.2同时G碱基转化率大于0.8的测序片段;e.保留G碱基转化率小于0.2同时C碱基转化率大于0.8的测序片段;
iii)提取测序深度大于10的单倍型;
iiii)筛除C碱基的甲基化频率为空的单倍型。
[2].根据[1]所述的设备,其特征在于,所述甲基化测序数据通过亚硫酸氢盐测序得到。
[3].一种用于选取能够判断受试者是否患有癌症或者对于癌症患者进行分型的DNA甲基化单倍型的设备,其包括
处理器;
用于存储执行指令的存储器;
其中,所述处理器执行指令时,实现选取能够判断受试者是否患有癌症或者对于癌症患者进行分型的DNA甲基化单倍型的方法,所述方法包括如下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安康优乐复生科技有限责任公司,未经安康优乐复生科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210101807.9/2.html,转载请声明来源钻瓜专利网。





