[发明专利]基于数据挖掘技术的心血管疾病患者虚弱症分级方法有效
| 申请号: | 201910357585.5 | 申请日: | 2019-04-29 |
| 公开(公告)号: | CN110010250B | 公开(公告)日: | 2023-05-26 |
| 发明(设计)人: | 冯云霞;韩正亮;李旭 | 申请(专利权)人: | 青岛科技大学 |
| 主分类号: | G16H50/70 | 分类号: | G16H50/70;G06F18/23;G06F18/214 |
| 代理公司: | 山东重诺律师事务所 37228 | 代理人: | 李常芳 |
| 地址: | 266000 山*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 数据 挖掘 技术 心血管疾病 患者 虚弱 分级 方法 | ||
1.一种基于数据挖掘技术的心血管疾病患者虚弱症分级方法,其特征在于:具体步骤如下:步骤一,在平台上建立用于对患者信息进行管理与使用的患者用户档案,用户档案与对应患者信息建立一一映射;
步骤二,首先,患者的数据信息通过患者或医生填入数据库;然后,平台将数据存储到硬盘或内存中;
步骤三,首先,用户或医生将患者就诊时自诉的症状信息与医生对患者的诊断信息通过平台登入窗口上报至数据云处理器;然后,数据云处理器对症状信息与诊断信息存储与预处理;其次,将预处理后的信息作为分类模型的训练的数据项;
步骤四,首先,将数据项的数据从数据云处理器导入脱敏化模块中;然后,脱敏化模块对数据进行脱敏化处理;
步骤五,将脱敏化处理数据导入正则化预处理模块,正则化预处理模块将数据项的文本数据进行数值化;
步骤六,建立对照表模块,然后将数值化后的患者数据导入;其中,
步骤七,首先,根据平台处理能力和数据量情况,选取分组的模;然后,将对照表模块得到的数据分成若干组,并导入分组模块中;其次,将每组数据导入判定模块中;
步骤八,判定模块判定分组模块传入的数据量,进行判定:
若该组含有数据的条数等于分组的模,则进行批处理导入主成分分析模块;
若数据量小于分组的模,首先,先将此部分数据导入数据模型模块处理一次,得出此患者的虚弱值;然后,将获得的虚弱值随数据模型模块数据一起向下导入,同时将此分组数据存入此判定模块的数据栈中;
其次,统计数据栈中的数据量并进行判定:
如果统计数据栈中的数据量超过分组的模,则取出时间序列中前分组的模的数据,分成一组,导入主成分分析模块,剩下的数据继续等待合并新的数据集;
如果未超过分组的模,则合并后继续等待新的数据;
步骤九,主成分分析模块对从步骤八传入的数据进行主成分分析;
首先,对数据进行降维因子分析,当对于第一次进行分析时,先对所有数据项进行Person关联分析法,去除相关程度低的数据项,本数据集中最终选取10项数据项作为提取因子,将KMO值提升到0.7以上,达到主成分分析法适用的标准;然后,通过计算得到解释总方差,选取累计表达超过90%的初始特征、提取平方和,并获取成分矩阵;其次,将获取的数据与患者数据导入权重模块;
步骤十,将主成分分析模块的数据进行求取数据权重值;
首先,用得到的成分矩阵E与对应初始特征值t求商Q,即公式(1):
然后,将上一结果Q与方差S代入下一公式计算H,即公式(2):
即求出主成分的方差贡献度;
其次,对整体进行平移,使所有值为正数,获得H’,即公式(3):
H'=H+MIN(H) (3)
再次,对指标权重进行归一化,得出的结果为数据项fl_flag、xm_flag、ty_flag、xj_flag、kg_flag、xlsj_flag、gxy_flag、ng_flag、tnb_flag、ks_flag的权重值;
最后,将患者数据与得出的权重值导入下一模块;
步骤十一,对权重模块的值进行权重值的应用,首先,更新目前的权重,对第一次使用时初始值为0.1,直接更新;之后,每组的权重与目前的权重求均值并进行更新;其次,与权重相对应的数据项进行求积的和,获得一个1以内的数值,将其作为不健康度B,即公式(4):
其中,B:不健康度;
其中,Di表示:数据项i的权重值;
Hi表示:数据项i的数值;
表示患者的身体状况,与利用患者年龄生成的数据指标,该指标定为年龄度A;再次,组成一个2维数组,将每个数据表示成一个2维坐标中的点;最后,此数据为最终处理数据,并导入下一模块;
步骤十二,首先,将处理后的数据中年龄度A与不健康度B两项,按组输入高斯聚类模块,即公式(5):
μi:是第i个数据的n维均值向量;
其中μ是n维均值向量,∑是n*n的协方差矩阵,l为n维样本空间中的随机向量l,α为混合系数,将目标期望值分为三类:早期虚弱,中期虚弱,晚期虚弱,即将混合成分k设定为3,其次,计算每个数据对应各个混合成分的后验概率,即公式(6):
根据后验概率生成新的均值向量μ`、新的协方差矩阵∑`、新的混合系数α`,对模型中的均值向量、协方差矩阵和混合系数进行迭代更新,直到收敛为止;再次,对数据进行确定分类的簇标记,即公式(7):
γj=argmaxχji,j∈{1,2,...,k} (7);
其中,j用来确定数据属于哪一个簇;χji是数据i在第j簇的相似度聚类结果;
通过极大似然函数获得新混合成分;最后,将结果导入数据模型模块;
步骤十三,首先,在数据模型模块训练好之后,按组进行对比优化,并获取患者的虚弱值,如果患者的虚弱值已有则进行更新,否则对患者进行添加此数据项;然后,进行交叉验证进行优化,调整数据的权重和均值向量、协方差矩阵、混合系数;最后,获取新的系统模型;
步骤十四,从新的系统模型获得的数据即为最终数据;
步骤五的正则化预处理模块的数值化包括以下步骤,首先,从文本数据症状主诉、体征、病史、检查检验报告、以及疾病诊断结果中匹配正则表达式;然后,通过正则表达式识别出患者数据包括性别、年龄、头晕、胸闷、乏力、口干、咳嗽、血压高、血糖高、心慌、心悸、收缩压、舒张压、心率值、四肢肌力、心律齐、高血压病、糖尿病、冠心病、脑梗、肾脏病、以及心力衰竭;其次,根据文本数据的特征,将性别、头晕、胸闷、乏力、口干、咳嗽、血压高、血糖高、心慌、心悸、心率、四肢肌力、心律齐、高血压病、糖尿病、冠心病、脑梗死、肾脏病、以及心力衰竭作为状态数据,并对相应字段赋1,否则赋0;再次,对性别置男为0女为1;再后来,将检验检查数值类数据转换为设定的对应的等级值,并对其进行归一化处理;紧接着,根据研究报告得出的年龄与虚弱呈正相关,将年龄数据作为目标数据的一个维度,并将数据中100岁以上的数据剔除,对年龄数据直接做归一化处理,并将数据保存,作为最终模型的一个标度;步骤六的对照表模块为:
。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛科技大学,未经青岛科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910357585.5/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





