[发明专利]一种基于图表模型的健康风险预测方法在审
申请号: | 201910090787.8 | 申请日: | 2019-01-30 |
公开(公告)号: | CN109801713A | 公开(公告)日: | 2019-05-24 |
发明(设计)人: | 莫毓昌;李灿东;林栋;黄华林;连志杰 | 申请(专利权)人: | 华侨大学 |
主分类号: | G16H50/30 | 分类号: | G16H50/30;G16H50/70;G16H10/60 |
代理公司: | 泉州市众创致远专利代理事务所(特殊普通合伙) 35241 | 代理人: | 柴淑芳 |
地址: | 362000 福*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 异类 风险预测 健康检查 预测 权重矩阵 图表模型 算法 疾病 记录 半监督学习 高风险疾病 准确度 合成数据 输入形式 预测模型 数据集 构建 健康 查询 分类 探索 | ||
本发明公开了一种基于图表模型的健康风险预测方法,包括以下步骤:S1、设置n位参与者的健康检查记录的输入形式;S2、通过健康检查记录构建基于HER的异类图;S3、通过SHG‑Health算法从异类图中获得权重矩阵,并通过权重矩阵对疾病风险进行预测。本发明利用半监督学习(SSL)算法对疾病风险进行预测,并且探索了一个基于HER的异类图,用大部分未标记的数据在异类图中对逐步发展的情况进行分类。其可以通过查询参与者pi的记录,SHG‑Health预测参与者pi是否属于高风险疾病类别或“未知”类别,在健康检查数据集和合成数据集上具有显著的预测效果,相较于其他预测模型预测准确度较高,给疾病风险预测领域做出了极大的贡献。
技术领域
本发明涉及预测模型领域,尤其涉及一种基于图表模型的健康风险预测方法。
背景技术
半监督学习(SSL)在基于电子健康记录(EHRs)的医疗保健应用中引起了越来越多的关注。例如,专利网中的一种基于图形的SSL方法,该方法能够了解患者风险组,进行患者风险分层;一种基于图形的SSL联合训练方法,用于乳腺癌生存率预测。当学习者达成共识时,它迭代地将伪标签分配给无标签数据,并在有标签的集合中包含有伪标签实例,直到无标签集合停止减少;一种基于排序的肺结节图像分类的二部分图、一种基于事件序列构建了时间表型的时间图等;但是,这些方法中没有一个考虑“未知”类,并且它们都有针对所有类的预定义实例,无论是由专家还是通过其他机制实现的。
一般健康检查在许多国家是医疗保健的一个组成部分,识别有风险的参与者对早期预警和预防干预是很重要的。尽管电子健康记录已经吸引了越来越多的研究关注在近年来数据挖掘和机器学习社区,挖掘一般健康检查数据是一个尚未充分探讨过了,除了少数研究风险预测等慢性疾病预警系统的提出和以前工作中对健康分数分类框架。然而,这些都没有考虑到未标记的数据。学习风险预测分类模型的基本挑战在于,未标记数据构成了所收集数据的大部分。特别的,未标记的数据描述了健康检查参与者,他们的健康状况可能从健康到重病有很大的不同,区分他们的健康状况没有标准的答案。
发明内容
本发明目的是针对上述问题,提供一种基于图表模型的健康风险预测方法。
为了实现上述目的,本发明的技术方案是:
本发明通过挖掘健康检查记录(HERs)的方法,构建了一种基于图表的半监督学习算法用于对风险预测的模型,这种算法被称为SHG-Health(半监督异构健康图),探索了一个基于HER的异类图,称为HeteroHER图,用大部分未标记的数据对逐步发展的情况进行分类。首先,健康检查记录用图表表示,将所有相关病例联系在一起。其次,捕获数据项的多类型关系,并将其自然地映射到异构图中。第三,特性通过异类图上的标签传播过程以自己的类型加权。
该风险预测模型的建模方法包括以下步骤:
步骤1)设置n位参与者的健康测试记录输入形式;
步骤2)构建HeteroHER图模型;
步骤3)建立风险预测模型。
所述步骤1)具体操作如下:
1.1)设是参与者i的ni个记录的集合,ri是(xij,tij)的一个元素,是在时间tij的一个d维向量,则S={s1,...,sl,sl+1,...,sn}是n位参与者的健康测试记录集合。标记集合C={1,...,C},前l个参与者si(i≤l)被标记为yi∈C,剩余u=n-l位参与者sl+1,...,sl+u将不被标记(l<<u)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华侨大学,未经华侨大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910090787.8/2.html,转载请声明来源钻瓜专利网。