[发明专利]基因标志物在恶性肺结节筛查中的应用、筛查模型的构建方法和检测装置有效
申请号: | 202211220583.X | 申请日: | 2022-10-08 |
公开(公告)号: | CN115295074B | 公开(公告)日: | 2022-12-16 |
发明(设计)人: | 邵阳;吴雪;包华;刘睿;吴舒雨;吴旻;杨珊珊;刘思思;郑丽娟 | 申请(专利权)人: | 南京世和基因生物技术股份有限公司;南京世和医疗器械有限公司 |
主分类号: | G16B20/30 | 分类号: | G16B20/30;G16B40/00;G16B20/10;G06N20/00;G06K9/62 |
代理公司: | 南京新慧恒诚知识产权代理有限公司 32424 | 代理人: | 邓唯 |
地址: | 210032 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基因 标志 恶性 结节 中的 应用 模型 构建 方法 检测 装置 | ||
1.基因标志物在制备恶性肺结节筛查试剂中的应用,其特征在于,所述的基因标志物包括:
第一标志物:cfDNA片段比对至参考基因组的不同窗口中的短读段数量占比和长读段数量占比;
第二标志物:不同种类的cfDNA片段比对至参考基因组的5’端的m个碱基片段在全部碱基片段中的占比;
第三标志物:WGS数据中染色体上不同窗口中的拷贝数;
第四标志物:肿瘤新短序列占比;
第五标志物:核小体覆盖模式;
所述的第四标志物通过如下步骤获得:
穷举法生成长度为16bp的短序列集合A;在人类参考基因序列中穷举出所有的长度为16bp短序列集合B,从集合A中将集合B数据剔除后,定义为无效子;
从癌症数据库中获得不同癌种的样本WGS测序结果,提取出多次出现的碱基替换突变;根据碱基替换的位置,从无效子中找到包含这些碱基替换的无效子短序列集合C;
获取东亚人群中频率大于0.01的碱基替换突变;根据碱基替换的位置,从无效子中找到包含这些碱基替换的无效子短序列集合D;从集合C中将集合D的无效子序列排除,定义为新短序列;
统计出样本中能够读取到任意一个新短序列的样本数量,再针对每一个新短序列,搜索出包含这些新短序列的样本数量,将每一个新短序列的样本数量与所有能读取到任意新短序列的样本总数的比例;
所述的第五标志物通过如下步骤获得:
从GTRD数据库中获得转录因子,并从中排除掉不在CIS-BP数据库中有已知转录位点的转录因子;
将获得的转录因子的转录位点附近-5kb到+5kb范围作为窗口,获得可以比对至这些窗口中的长度为100-220bp的片段,对窗口中的读段数据依次进行GC校正和测序深度平滑处理,得到每个转录因子的覆盖模式曲线;
对于每个转录因子,获得如下三个特征,共同作为核小体覆盖模式:
1)对于转录因子的全部转录位点,求出转录位点的上端1kb到下端1kb的平均深度;
2)对于获得的覆盖模式曲线,获得曲线波谷的幅度值,作为转录因子的中心深度;
3)对于获得的覆盖模式曲线进行快速傅里叶变换,获得核小体振幅信号的最高点的振幅数值。
2.根据权利要求1所述的应用,其特征在于,所述的第一标志物通过如下步骤获得:将读段数据结果比对至参考基因组,将参考基因组划分为多个窗口,并分别获得在每个窗口范围内的短读段数量和超长读段数量占比;
所述的第二标志物通过如下步骤获得:将读段数据中的5’端的m个碱基数据作为碱基片段集合,并得到各种碱基片段在全部片段中所占比例;
所述的第三标志物通过如下步骤获得:将参考基因组划分为多个窗口,并分别获得WGS数据中1-22号染色体上不同窗口中的拷贝数数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京世和基因生物技术股份有限公司;南京世和医疗器械有限公司,未经南京世和基因生物技术股份有限公司;南京世和医疗器械有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211220583.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:高稳定性螺旋式线圈、线圈绑扎方法及电力变压器
- 下一篇:绝缘膜自动穿管机