[发明专利]淋巴结转移预测模型构建与训练方法、装置、设备和介质在审
申请号: | 202110406089.1 | 申请日: | 2021-04-15 |
公开(公告)号: | CN113113150A | 公开(公告)日: | 2021-07-13 |
发明(设计)人: | 陈万涛;张瑱;邹欣;曹巍 | 申请(专利权)人: | 上海交通大学医学院附属第九人民医院 |
主分类号: | G16H50/50 | 分类号: | G16H50/50;G16H50/20;G16B30/00;G06N20/00 |
代理公司: | 上海光华专利事务所(普通合伙) 31219 | 代理人: | 李治东 |
地址: | 200011 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 淋巴结 转移 预测 模型 构建 训练 方法 装置 设备 介质 | ||
本申请提供的一种淋巴结转移预测模型构建与训练方法、装置、设备和介质,本申请通分别获取多个转录组样本测序数据或多个miRNA样本测序数据,并从中筛选出m个转录组标记物或n个miRNA标记物;根据留一交叉验证法将样本测序数据分为训练集与测试集;判断是否发生淋巴结转移以计算二值化的转移值,并进行去均值的归一化处理,进行偏最小二乘回归模型和逻辑回归模型的建立,将测试集score值作为预测结果,得到测试集的逻辑回归预测值;循环M次以完成淋巴结转移预测模型的训练。本申请通过将标记物的表达矩阵带入机器学习模型,可实现对淋巴结转移的判断,利用转录组和miRNA两个层面数据,可将AUC提高到了90%以上,极大提高了诊断效率。
技术领域
本发明涉及机器学习技术领域,特别是涉及一种淋巴结转移预测模型构建与训练方法、装置、设备和介质。
背景技术
口腔鳞癌是口腔颌面部最为常见的恶性肿瘤之一,晚期口腔鳞癌5年生存率差,其中淋巴结转移是口腔鳞癌患者生存预测的独立预测指标。提高口腔鳞癌患者淋巴结转移预测水平,有利于指导治疗手段的制定,是临床上提高口腔鳞癌患者生存率的主要方式之一。目前淋巴结转移预测仍然依赖于影像学和临床专科检测,由于医师专业水平存在地域及培训教育水平的差异,临床上淋巴结转移预测准确性和特异性都不高。
随着精准医学的发展,分子分型主导的诊断技术越来越受到重视。基于转录组高通量测序技术和机器学习(Machine Learning)技术对分子标志物进行筛选并建立诊断模型,保证了判断的敏感性和特异性,从而实现口腔癌淋巴结转移的高效诊断。
发明内容
鉴于以上所述现有技术的缺点,本申请的目的在于提供一种淋巴结转移预测模型构建与训练方法、装置、设备和介质,以解决现有技术中的问题。
为实现上述目的及其他相关目的,本申请提供一种淋巴结转移预测模型构建与训练方法,所述方法包括:S1、分别获取多个转录组样本测序数据或多个miRNA样本测序数据,并从中筛选出m个转录组标记物或n个miRNA标记物;S2、根据留一交叉验证法选取1个转录组/miRNA样本测序数据为测试集,剩余的转录组/miRNA样本测序数据为训练集,同时判断每个样本测序数据是否发生淋巴结转移以计算二值化的第一转移值矩阵;S3、对训练集中每个标记物的表达量以及第一转移值矩阵中各转移值进行去均值的归一化处理,以得到训练集表达量矩阵、测试集表达量矩阵、及第二转移值矩阵;S4、利用训练集表达量矩阵和第二转移值矩阵进行偏最小二乘回归模型的建立,并基于偏最小二乘的结果中提取的loading值,得到训练集score值和测试集score值;S5、利用训练集score值和第一转移值矩阵进行逻辑回归模型的建立,并将测试集score值作为预测结果,得到测试集的逻辑回归预测值;S6、返回步骤S2重新选取转录组/miRNA样本测序数据为测试集,直至获得所有转录组/miRNA样本测试数据作为测试集所对应的逻辑回归预测值,以供完成淋巴结转移预测模型的训练。
于本申请的一实施例中,在筛选出标记物后,且在划分测序集之前,从全部转录组样本测序数据与全部miRNA样本测序数据中选取二者基于同一样本数据进行测序的转录组样本测序数据miRNA样本测序数据。
于本申请的一实施例中,建立偏最小二乘回归模型后,分别提取对应转录组水平的组分数量或特征数,以及对应miRNA水平的组分数量或特征数。
于本申请的一实施例中,所述判断每个样本测序数据是否发生淋巴结转移以计算二值化的第一转移值矩阵,包括:依据临床信息判断样本测序数据是否发生淋巴结转移;定义发生淋巴结转移为1,不发生淋巴结转移为0,以此计算表征样本测序数据是否发生淋巴结转移的二值化的第一转移值矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学医学院附属第九人民医院,未经上海交通大学医学院附属第九人民医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110406089.1/2.html,转载请声明来源钻瓜专利网。