[发明专利]一种将多种主要不良心血管事件预测模型融合的集成预测方法在审
申请号: | 201710178405.8 | 申请日: | 2017-03-23 |
公开(公告)号: | CN107122589A | 公开(公告)日: | 2017-09-01 |
发明(设计)人: | 黄正行;胡丹青;段会龙 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 杭州天勤知识产权代理有限公司33224 | 代理人: | 陈华 |
地址: | 310013 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 多种 主要 不良 心血管 事件 预测 模型 融合 集成 方法 | ||
1.一种将多种主要不良心血管事件预测模型融合的集成预测方法,其特征在于,所述主要不良心血管事件预测模型包括基于队列研究的模型和基于电子病历研究的模型;所述集成预测方法包括如下步骤:
1)将待融合主要不良心血管事件预测模型的输出结果分别二值化;
2)根据步骤1)中二值化后的待融合主要不良心血管事件预测模型的输出结果,使用粗糙集理论计算各独立预测模型的权重值;
3)将待融合主要不良心血管事件预测模型的输出结果分别归一化;
4)针对步骤3)中归一化后的待融合主要不良心血管事件预测模型的输出结果,将其最佳分类阈值点格式化为0.5;
5)根据步骤2)中计算的各独立预测模型的权重值和步骤4)中得到的各独立预测模型的输出结果,计算各患者的基本概率分配;
6)针对步骤5)中得到的各患者的基本概率分配,使用Dempster规则合成方法,将各独立预测模型输出项结合,得到结合的mass函数;
7)根据步骤6)中得到的结合的mass函数,计算最终的集成预测方法的输出值。
2.根据权利要求1所述的将多种主要不良心血管事件预测模型融合的集成预测方法,其特征在于,所述基于队列研究的模型包括全球急性冠脉综合事件注册评分、心肌梗死溶栓治疗疗法指南和不稳定心绞痛中血小板糖蛋白IIb/IIIa:依替巴肽对受体抑制实验中所用模型的一种或几种;
所述基于电子病历研究的模型包括支持向量机、带范数一的逻辑回归或分类回归树中的一种或几种。
3.根据权利要求1所述的将多种主要不良心血管事件预测模型融合的集成预测方法,其特征在于,所述步骤1)中输出结果分别二值化是指:
使用待融合主要不良心血管事件预测模型的输出结果ROC曲线上最靠近图像左上角的点作为最佳阈值点进行二值化。
4.根据权利要求3所述的将多种主要不良心血管事件预测模型融合的集成预测方法,其特征在于,所述步骤2)中使用粗糙集理论计算各独立预测模型的权重值是指:
在粗糙集理论中,定义信息系统其中,对象集合O={o1,o2,...,ot}是由有限t个对象o组成的非空集合,属性集合A={a1,a2,...,an}是由有限n个属性a组成的非空集合,结果集合R={r1,r2,...,rm}是由有限m个结果r组成的非空集合;
对于每一个子集都有一个等价关系,所述等价关系定义为:
根据等价关系IND(P),所述对象集合O={o1,o2,...,ot}能够被分割成不同的子集,该不同的子集的集合定义为O/IND(P),O/IND(P)中任意的一个元素都被称为等价类;
根据公式1.1,得到所述信息系统关于属性集合A={a1,a2,...,an}、排除了属性aj的属性集合A-{aj}以及结果集合R={r1,r2,...,rm}的等价关系:
根据信息熵理论,所述信息系统中结果集合R={r1,r2,...,rm}对于属性集合A={a1,a2,...,an}的依赖性为:
其中,[x]是在O/IND(A)中的等价划分,[y]是在O/IND(R)中的等价划分,p[x]=|[x]|/|[y]|且p([y]/[x])=|[y]∩[x]|/|[x]|;
所述结果集合R={r1,r2,...,rm}对于排除了属性aj的属性集合A-{aj}的依赖性为:
所述属性aj的显著性为:
所述属性aj的权重值为:
根据上述公式1.2-1.8,计算各独立预测模型的权重值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710178405.8/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用