[发明专利]一种深肌层浸润数据预测方法及系统在审
申请号: | 202110487110.5 | 申请日: | 2021-05-04 |
公开(公告)号: | CN113178264A | 公开(公告)日: | 2021-07-27 |
发明(设计)人: | 林凤;易新凯;唐震洲;周铭琰;黎玮 | 申请(专利权)人: | 温州医科大学附属第一医院 |
主分类号: | G16H50/70 | 分类号: | G16H50/70 |
代理公司: | 温州名创知识产权代理有限公司 33258 | 代理人: | 陈加利 |
地址: | 325000 *** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 深肌层 浸润 数据 预测 方法 系统 | ||
本发明提供一种深肌层浸润数据预测方法,包括获取深肌层浸润数据集和深肌层非浸润数据集形成为原始样本数据;取出特征值和预测值,并选择预设的Borderline‑Smote模型,对原始样本数据进行不平衡数据处理;将处理样本数据与原始样本数据混合并归一化处理,划分成测试集和多个训练集;选取决策树类型,训练每一个训练集对应的CART决策树模型;对所有决策树模型中特征评估,得到满足预定条件的特征集;通过基尼指数的对比选出最优特征来进行分支处理决策树,得到随机森林;获取待测试数据集导入训练好的随机森林模型中,区别出深肌层浸润或非浸润数据。实施本发明,能在分析预测过程中提高深肌层浸润数据的占比,使得预测精度高且较易实现。
技术领域
本发明涉及计算机数据处理技术领域,尤其涉及一种深肌层浸润数据预测方法及系统。
背景技术
肌层浸润深度是多种肿瘤包括子宫内膜癌预后的独立危险因素,同时也是评定临床分期的重要参考因素。术前肿瘤肌层浸润深度评估对于术后的治疗策略包括放化疗的选择具有重要意义。此外,肌层浸润还是影响预后的关键因素,在子宫内膜癌预后相关因素的分析中,深肌层浸润的贡献率相对其他因素较大。研究表明,子宫内膜癌患者中淋巴结受累与子宫肌层浸润深度大于50%密切相关。子宫内膜癌伴有深肌层浸润者,腹主动脉旁淋巴结转移的发生率为21.1%,盆腔淋巴结转移的发生率高达43.0%,深肌层浸润患者较浅肌层浸润患者病死率高出3.619倍。因此,对肌层浸润相关影响因素的研究极具意义,不仅有助于术前分期的评判,还可对患者的预后进行预测。
深肌层浸润情况是对深肌层浸润数据进行深度分析预测所得,然而在分析预测过程中往往存在大量的深肌层非浸润数据,极大的影响了数据预测的准确性。因此,有必要对深肌层浸润数据进行准确的预测。
发明内容
本发明实施例所要解决的技术问题在于,提供一种深肌层浸润数据预测方法及系统,能在分析预测过程中提高深肌层浸润数据的占比,使得预测精度高且较易实现。
为了解决上述技术问题,本发明实施例提供了一种深肌层浸润数据预测方法,包括以下步骤:
步骤S1、获取深肌层浸润数据集和深肌层非浸润数据集来形成样本数据,并将所获取的样本数据进行缺失值处理之后作为原始样本数据;
步骤S2、取出所述原始样本数据的特征值和预测值,并选择预设的Borderline-Smote模型,对所述原始样本数据进行不平衡数据处理;
步骤S3、将不平衡数据处理得到的样本数据与所述原始样本数据进行混合,得到一个新样本数据集并进行归一化处理,且进一步将归一化处理的新样本数据划分成测试集和多个训练集;
步骤S4、选取随机森林的决策树为CART类型,并分别训练每一个划分好的训练集,得到每一个训练集相对应的CART决策树模型;
步骤S5、利用特征的重要性,对每一个CART决策树模型中的所有特征均进行评估,得到每一个CART决策树模型中满足预定条件的特征集;
步骤S6、通过基尼指数的对比选出最优特征来对所有的CART决策树模型中满足所述预设条件的特征集进行分支处理,得到所有CART决策树模型经过分支处理后的决策树,并形成随机森林;其中,将选出的最优特征按照基尼指数从大到小的顺序进行剪枝排序,且所选的最优特征均是深肌层浸润数据区别于深肌层非浸润数据的关键特征;
步骤S7、获取待测试数据集,将所述待测试数据集导入到训练好的随机森林模型中,区别出所述待测试数据集为深肌层浸润数据集或深肌层非浸润数据集。
其中,在所述步骤S2中,所述选择预设的Borderline-Smote模型,对所述原始样本数据进行不平衡数据处理的具体步骤包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于温州医科大学附属第一医院,未经温州医科大学附属第一医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110487110.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于工件去毛刺的清洁装置
- 下一篇:一种建筑电气工程线管预留接头模具
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置