[发明专利]基于LightGBM算法的门诊量预测系统及预测方法有效
申请号: | 201910276901.6 | 申请日: | 2019-04-08 |
公开(公告)号: | CN110046757B | 公开(公告)日: | 2022-11-29 |
发明(设计)人: | 刘健;张瑶;张翼飞;李宝娟;黄鹏;韦磊;尚子田;宁玉文;张军超;靳豪杰;许浩;唐甜;冯健飞;沈霞娟 | 申请(专利权)人: | 中国人民解放军第四军医大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G16H40/20 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 徐文权 |
地址: | 710032 陕西*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 lightgbm 算法 门诊 预测 系统 方法 | ||
1.一种基于LightGBM算法的门诊量预测系统,其特征在于,包括数据预处理模块、特征构建模块、特征选择模块和模型训练模块;其中:
数据预处理模块,用于从原始门诊信息中提取原始门诊量数据;
特征构建模块,用于将原始门诊量数据,以及包含时间信息和百度指数信息的外部数据分别构建得到门诊量特征、时间特征和关键字百度指数特征;
特征选择模块,用于从门诊量特征、时间特征和关键字百度指数特征中选取相关系数≥0.1且置信概率≤0.005的特征,再利用遗传算法,进行筛选确认,获得样本特征;
模型训练模块,用于利用样本特征在训练数据集上使用LightGBM算法对预测模型进行训练,构建得到基于LightGBM的门诊量预测模型;
其中,特征构建模块中,构建的时间特征为:当天是否为休息日、当天所在假期的长度、当天到前/后一个假期的时间间隔、当天前/后一个假期的长度、当天是否为周一/二/三/四/五/六/日;
构建的门诊量特征为:一定时间间隔的门诊量特征、一定时间间隔的一定时间范围内的门诊量的均值、方差、标准差、偏度、峰度、中位数、最大值以及最小值;
构建的关键字百度指数特征为:利用爬虫获取的与某项疾病相关的关键字的百度指数,然后根据该百度指数计算与当天具有一定时间间隔且在一定时间范围内的百度指数的均值、方差、标准差、偏度、峰度、中位数、最大值以及最小值。
2.根据权利要求1所述的基于LightGBM算法的门诊量预测系统,其特征在于,数据预处理模块中,从原始门诊信息中提取原始门诊量数据是指移除具有规律性的人员数据和错误的门诊数据。
3.根据权利要求2所述的基于LightGBM算法的门诊量预测系统,其特征在于,原始门诊信息包括门诊用户的来访日期、病人ID、诊断信息以及疾病信息;所述的具有规律性的人员数据包括取药人员、开药人员、复诊人员和复查人员;所述的错误的门诊数据包括挂错号人员、fuchsa人员、fuccha人员和买药人员;
其中,fuchsa人员、fuccha人员是由于医生个人笔误造成的结果。
4.采用权利要求1~3中任意一项所述的基于LightGBM算法的门诊量预测系统进行疾病门诊量预测的方法,其特征在于,包括以下步骤:
1)数据预处理
获取某疾病对应某医院某科室的原始门诊信息,从该原始门诊信息中提取原始门诊量数据;
2)特征构建
结合经过数据预处理的原始门诊量数据,以及从外部数据中引入的时间信息数据和关键字百度指数信息数据,分别构建得到门诊量特征、时间特征及关键字百度指数特征;
3)特征选择
从步骤2)构建的三类特征中,先选取相关系数≥0.1且置信概率≤0.005的特征,再利用遗传算法,进行筛选确认,获得样本特征;
4)模型训练
利用样本特征,在训练数据集上使用LightGBM算法对预测模型进行训练,构造基于LightGBM的疾病门诊量预测模型,获得某疾病的门诊量预测数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军第四军医大学,未经中国人民解放军第四军医大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910276901.6/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理