[发明专利]一种基于体检数据建模的空腹血糖预测方法有效

专利信息
申请号: 201610065891.8 申请日: 2016-01-31
公开(公告)号: CN107194138B 公开(公告)日: 2023-05-16
发明(设计)人: 纪俊;于滨;肖文翔;王嵩;朱易辰 申请(专利权)人: 北京万灵盘古科技有限公司
主分类号: G16H50/70 分类号: G16H50/70;G16H50/30;G16H50/20
代理公司: 深圳舍穆专利代理事务所(特殊普通合伙) 44398 代理人: 黄贤炬
地址: 100089 北京市海淀*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 体检 数据 建模 空腹 血糖 预测 方法
【权利要求书】:

1.一种基于体检数据建模的空腹血糖预测方法,其特征在于:其包括以下步骤:

步骤1:数据选择与处理;包括从海量体检数据中提取关键信息以及对数据的清洗和转换;

步骤2:数据集的建立;对处理后的数据进行特征构建,每行表示为一个人的体检记录,每列表示一项体检项特征,得到包含所有特征集合的数据集dataset1;

步骤3:重要特征选取;按以下步骤进行:

(3.1)利用随机森林方法对特征集合中的每一个特征计算其特征重要性,并据此计算体检项重要性得分;

(3.2)结合序列后向选择算法:从dataset1全部特征集合s开始,对s对应训练集进行建模,并计算其在测试集上AUC,然后去掉得分最低的体检项对应特征,建模并计算在测试集上AUC,直至特征集合s中只含有一个体检项,选取具有最大AUC值的特征集合为最优特征集合optimalset;

步骤4:血糖预测模型构建与评价,其步骤如下:

(4.1)使用随机划分的方式,将最优特征集合optimalset对应的最优数据集optimaldataset

按比例分割为训练集Xtrain和测试集Xtest;

(4.2)使用包含大量决策树的随机森林拟合训练集Xtrain,每棵决策树使用数据由原数据随机抽取,决策树生成过程中,每个分割节点从全部特征集合中随机选择p个特征,从中选择最佳划分特征;

随机森林生成后,血糖预测值是各决策树血糖预测值的均值,此时,血糖预测的回归模型建立完毕;

(4.3)根据模型对测试集Xtest进行预测,得到未来一年的空腹血糖预测值,以该值减体检者上一年的空腹血糖值,差值为正说明预测该体检者空腹血糖上升,差值为负说明该体检者空腹血糖下降,得到关于体检者空腹血糖变化的预测,空腹血糖变化上升表示为1,下降表示为0,差值表示预测得分;

(4.4)根据测试集,使用体检者第四年空腹血糖减第三年空腹血糖,得到体检者真实空腹血糖变化,将其转化为0-1表示;

(4.5)根据预测得分和体检者真实数据变化的0-1表示,通过ROC曲线对应的AUC值,对模型性能进行评价;

步骤5:空腹血糖变化预测的概率化打分:

(5.1)将最优特征集合optimalset对应的最优数据集optimaldataset划分为训练集、测试集、验证集三部分;

(5.2)使用训练集结合随机森林方法建立空腹血糖值预测模型,使用测试集计算不同概率化打分对应阈值,预测验证集的概率化打分;

(5.3)结合验证集概率化打分,选定概率化得分80分以上体检者为血糖变化概率较大人群,基于选定的阈值,验证模型表现。

2.根据权利要求1所述的一种基于体检数据建模的空腹血糖预测方法,其特征在于:步骤1中数据的清洗和转换包括:对残缺、错误数据,将其值置为空;对重复数据进行删除;格式不标准数据,通过数值编码方式统一处理为数值格式。

3.根据权利要求1所述的一种基于体检数据建模的空腹血糖预测方法,其特征在于:步骤(3.2)中,按如下步骤进行:

A.使用体检项重要性计算过程中得到的体检项重要性得分,对体检项按照得分高低进行重要性排序;

B.根据全部特征s对应数据集,使用随机森林训练模型,并计算相应的AUC值;

C.从体检项集合中,去掉得分最低体检项对应的特征,使用余下特征对应数据集训练随机森林模型,并计算相应的AUC值;

D.重复步骤C,直至体检项集合只包含一个体检项;

E.根据上述步骤,得到对应最优AUC值的体检项集合,进一步得到最优的特征集合optimalset;

F.根据以上过程得到的最优特征集合optimalset,对应数据集可以得到最优模型。

4.根据权利要求1所述的一种基于体检数据建模的空腹血糖预测方法,其特征在于:步骤1中提取的关键信息为不同体检者不少于三年的体检信息。

5.根据权利要求4所述的一种基于体检数据建模的空腹血糖预测方法,其特征在于:步骤1中提取的关键信息包括人口统计学信息、血常规检测、血生化检测、尿常规检测、内科、心电图科目下的一种或多种信息。

6.根据权利要求5所述的一种基于体检数据建模的空腹血糖预测方法,其特征在于:步骤1中提取的关键信息包括:

空腹血糖、年龄、腰围、体重、身腰比、体重指数、尿糖、尿素、肌酐、脂肪肝、AST/ALT、血清天门冬氨酸氨基转移酶、血清丙氨酸氨基转移酶、红细胞分布宽度、红细胞比积、平均血红蛋白浓度、血清甘油三酯、血检-红细胞、红细胞平均体积、身高、血清低密度脂蛋白胆固醇、血清高密度脂蛋白胆固醇、中性粒细胞总数、平均血红蛋白含量、血液比重、中性粒细胞百分数、收缩压、淋巴细胞百分数、血检-白细胞、血小板分布宽度、舒张压、性别、淋巴细胞总数、血小板数、尿酸碱度、血清总胆固醇、平均血小板体积、尿酮体、尿检-红细胞、裂隙灯、双下肢水肿、亚硝酸盐、尿胆红素、心电图、心率、尿检-白细胞、尿胆原、尿蛋白。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京万灵盘古科技有限公司,未经北京万灵盘古科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201610065891.8/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top