[发明专利]通过低深度全基因组测序技术预测髓母细胞瘤分型的计算机可读存储介质和装置及其应用有效
申请号: | 202310454365.0 | 申请日: | 2023-04-25 |
公开(公告)号: | CN116168762B | 公开(公告)日: | 2023-06-27 |
发明(设计)人: | 马景娇 | 申请(专利权)人: | 北京泛生子基因科技有限公司 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B40/00;G16B5/00 |
代理公司: | 北京纪凯知识产权代理有限公司 11245 | 代理人: | 关畅 |
地址: | 102206 北京市昌平区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 通过 深度 基因组 技术 预测 细胞 瘤分型 计算机 可读 存储 介质 装置 及其 应用 | ||
1.预测髓母细胞瘤患者分子亚型的计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于:所述计算机程序使计算机执行如下步骤:
A1)获得已知分子亚型髓母细胞瘤样本的测序数据、年龄和性别特征;
A2)对所述已知分子亚型髓母细胞瘤样本的测序数据进行CNV检测获得已知分子亚型髓母细胞瘤样本的CNV结果,对所述已知分子亚型髓母细胞瘤样本的CNV结果进行高频CNV检测获得已知分子亚型髓母细胞瘤样本的arm-level SCNA和focal SCNA结果;
A3)基于48个特征,使用机器学习算法构建髓母细胞瘤分子分型模型;所述48个特征包括从所述arm-level SCNA和focal SCNA结果中获取的36个染色体臂水平拷贝数变异特征和10个基因水平拷贝数变异特征,以及年龄特征和性别特征;所述36个染色体臂包括:1p,1q,2p,2q,3p,3q,4p,4q,5p,5q,6p,6q,7p,7q,8p,8q,9p,9q,10p,10q,11p,11q,13q,14q,16p,16q,17p,17q,18p,18q,19p,19q,20q,21p,21q和22q;所述p代表染色体短臂,所述q代表染色体长臂;所述10个基因包括:MYCN,GLI2,MYC,PVT1,OTX2,SCAPER,WWOX,SIRPB1,PTCH1和SMYD4;
A4)获取待测髓母细胞瘤患者的测序数据;将所述测序数据比对到参考基因组获得比对结果文件;
A5)对所述比对结果文件进行CNV检测获得待测髓母细胞瘤患者CNV结果;将所述待测髓母细胞瘤患者的CNV结果和所述已知分子亚型髓母细胞瘤样本的CNV结果进行合并获得合并CNV结果;检测所述合并CNV结果,获得高频CNV结果;基于所述高频CNV结果提取待测髓母细胞瘤患者的arm-level SCNA和focal SCNA结果;
A6)基于所述待测髓母细胞瘤患者的arm-level SCNA和focal SCNA结果以及年龄和性别信息提取待测髓母细胞瘤患者的所述48个特征,基于所述待测髓母细胞瘤患者的所述48个特征使用所述髓母细胞瘤分子分型模型预测待测髓母细胞瘤患者分子亚型分型。
2.根据权利要求1所述的计算机可读存储介质,其特征在于:所述待测髓母细胞瘤患者的测序数据为低深度全基因组测序数据;所述低深度为所述测序数据的测序深度大于等于2。
3.根据权利要求1或2所述的计算机可读存储介质,其特征在于:所述机器学习算法为朴素贝叶斯、随机森林、AdaBoost迭代算法、逻辑回归或支持向量机。
4.根据权利要求1或2所述的计算机可读存储介质,其特征在于:所述机器学习算法为支持向量机;所述支持向量机的核函数为线型核函数kernel='linear'。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京泛生子基因科技有限公司,未经北京泛生子基因科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310454365.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:零序导纳保护纳米继电器
- 下一篇:一种用于航海激光测距仪