[发明专利]一种基于体检数据建模的空腹血糖预测方法有效
申请号: | 201610065891.8 | 申请日: | 2016-01-31 |
公开(公告)号: | CN107194138B | 公开(公告)日: | 2023-05-16 |
发明(设计)人: | 纪俊;于滨;肖文翔;王嵩;朱易辰 | 申请(专利权)人: | 北京万灵盘古科技有限公司 |
主分类号: | G16H50/70 | 分类号: | G16H50/70;G16H50/30;G16H50/20 |
代理公司: | 深圳舍穆专利代理事务所(特殊普通合伙) 44398 | 代理人: | 黄贤炬 |
地址: | 100089 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 体检 数据 建模 空腹 血糖 预测 方法 | ||
1.一种基于体检数据建模的空腹血糖预测方法,其特征在于:其包括以下步骤:
步骤1:数据选择与处理;包括从海量体检数据中提取关键信息以及对数据的清洗和转换;
步骤2:数据集的建立;对处理后的数据进行特征构建,每行表示为一个人的体检记录,每列表示一项体检项特征,得到包含所有特征集合的数据集dataset1;
步骤3:重要特征选取;按以下步骤进行:
(3.1)利用随机森林方法对特征集合中的每一个特征计算其特征重要性,并据此计算体检项重要性得分;
(3.2)结合序列后向选择算法:从dataset1全部特征集合s开始,对s对应训练集进行建模,并计算其在测试集上AUC,然后去掉得分最低的体检项对应特征,建模并计算在测试集上AUC,直至特征集合s中只含有一个体检项,选取具有最大AUC值的特征集合为最优特征集合optimalset;
步骤4:血糖预测模型构建与评价,其步骤如下:
(4.1)使用随机划分的方式,将最优特征集合optimalset对应的最优数据集optimaldataset
按比例分割为训练集Xtrain和测试集Xtest;
(4.2)使用包含大量决策树的随机森林拟合训练集Xtrain,每棵决策树使用数据由原数据随机抽取,决策树生成过程中,每个分割节点从全部特征集合中随机选择p个特征,从中选择最佳划分特征;
随机森林生成后,血糖预测值是各决策树血糖预测值的均值,此时,血糖预测的回归模型建立完毕;
(4.3)根据模型对测试集Xtest进行预测,得到未来一年的空腹血糖预测值,以该值减体检者上一年的空腹血糖值,差值为正说明预测该体检者空腹血糖上升,差值为负说明该体检者空腹血糖下降,得到关于体检者空腹血糖变化的预测,空腹血糖变化上升表示为1,下降表示为0,差值表示预测得分;
(4.4)根据测试集,使用体检者第四年空腹血糖减第三年空腹血糖,得到体检者真实空腹血糖变化,将其转化为0-1表示;
(4.5)根据预测得分和体检者真实数据变化的0-1表示,通过ROC曲线对应的AUC值,对模型性能进行评价;
步骤5:空腹血糖变化预测的概率化打分:
(5.1)将最优特征集合optimalset对应的最优数据集optimaldataset划分为训练集、测试集、验证集三部分;
(5.2)使用训练集结合随机森林方法建立空腹血糖值预测模型,使用测试集计算不同概率化打分对应阈值,预测验证集的概率化打分;
(5.3)结合验证集概率化打分,选定概率化得分80分以上体检者为血糖变化概率较大人群,基于选定的阈值,验证模型表现。
2.根据权利要求1所述的一种基于体检数据建模的空腹血糖预测方法,其特征在于:步骤1中数据的清洗和转换包括:对残缺、错误数据,将其值置为空;对重复数据进行删除;格式不标准数据,通过数值编码方式统一处理为数值格式。
3.根据权利要求1所述的一种基于体检数据建模的空腹血糖预测方法,其特征在于:步骤(3.2)中,按如下步骤进行:
A.使用体检项重要性计算过程中得到的体检项重要性得分,对体检项按照得分高低进行重要性排序;
B.根据全部特征s对应数据集,使用随机森林训练模型,并计算相应的AUC值;
C.从体检项集合中,去掉得分最低体检项对应的特征,使用余下特征对应数据集训练随机森林模型,并计算相应的AUC值;
D.重复步骤C,直至体检项集合只包含一个体检项;
E.根据上述步骤,得到对应最优AUC值的体检项集合,进一步得到最优的特征集合optimalset;
F.根据以上过程得到的最优特征集合optimalset,对应数据集可以得到最优模型。
4.根据权利要求1所述的一种基于体检数据建模的空腹血糖预测方法,其特征在于:步骤1中提取的关键信息为不同体检者不少于三年的体检信息。
5.根据权利要求4所述的一种基于体检数据建模的空腹血糖预测方法,其特征在于:步骤1中提取的关键信息包括人口统计学信息、血常规检测、血生化检测、尿常规检测、内科、心电图科目下的一种或多种信息。
6.根据权利要求5所述的一种基于体检数据建模的空腹血糖预测方法,其特征在于:步骤1中提取的关键信息包括:
空腹血糖、年龄、腰围、体重、身腰比、体重指数、尿糖、尿素、肌酐、脂肪肝、AST/ALT、血清天门冬氨酸氨基转移酶、血清丙氨酸氨基转移酶、红细胞分布宽度、红细胞比积、平均血红蛋白浓度、血清甘油三酯、血检-红细胞、红细胞平均体积、身高、血清低密度脂蛋白胆固醇、血清高密度脂蛋白胆固醇、中性粒细胞总数、平均血红蛋白含量、血液比重、中性粒细胞百分数、收缩压、淋巴细胞百分数、血检-白细胞、血小板分布宽度、舒张压、性别、淋巴细胞总数、血小板数、尿酸碱度、血清总胆固醇、平均血小板体积、尿酮体、尿检-红细胞、裂隙灯、双下肢水肿、亚硝酸盐、尿胆红素、心电图、心率、尿检-白细胞、尿胆原、尿蛋白。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京万灵盘古科技有限公司,未经北京万灵盘古科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610065891.8/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置