[发明专利]一种用于治未病的医疗数据挖掘方法在审
申请号: | 201711307752.2 | 申请日: | 2017-12-11 |
公开(公告)号: | CN107945879A | 公开(公告)日: | 2018-04-20 |
发明(设计)人: | 张吕峥;高春蓉;方宝林;余小益;朱旭东 | 申请(专利权)人: | 创业软件股份有限公司 |
主分类号: | G16H50/70 | 分类号: | G16H50/70 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙)33240 | 代理人: | 朱月芬 |
地址: | 310013 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 治未病 医疗 数据 挖掘 方法 | ||
技术领域
本发明涉及一种用于治未病的医疗数据挖掘方法。
背景技术
医疗大数据对海量的历史病例和健康人群的体征数据进行长期跟踪、分 析和处理,可以对体征数据的变化趋势进行学习,发现具有较高患病风险的 人群。对这些人群进行针对性的预防和早期检查措施,可以有效降低发病率 或者使发现时间提早。借用中医中治未病的概念,本发明专利提出一种用于 治未病的医疗数据挖掘方法。
目前普遍使用传统统计方法对于疾病进行检测,例如统计指标A对疾病g 的灵敏度和特异性。其中:
灵敏度=真阳性人数/(真阳性人数+假阴性人数)*100%
特异度=真阴性人数/(真阴性人数+假阳性人数)*100%
使用同样的方法也可以得到一些疾病的前驱症状,从而对疾病进行提前 发现,使病人可以尽早获得诊断和治疗。
现在一些互联网企业开始使用网络数据对流行性疾病进行预测,例如百 度和谷歌根据不同区域人群的搜索词频来判断流感的扩散趋势:一个区域的 人群如果在某一时间对感冒、发烧、板蓝根等词汇的搜索频率提升时,通常 会认为感冒的发病率提高,如果临近区域对同一类词汇的搜索频率相继提升 时,会认为可能出现流感。
但是在症状或者检验指标呈阳性时,往往疾病已经发生,互联网手段也 只能对群体性的疾病传播进行预测和控制,而对个体的疾病预测并无帮助。
当前,随着便携式电子设备的迅猛发展和常规体检的普及,如何对体征 和检验大数据进行分析和挖掘,根据个体的体征及变化趋势,在疾病发生之 前进行预测,使得针对性的预防成为可能,极大的提高人民的生活质量,并 有效节省医疗资源。
发明内容
本发明的核心思想,是对每种疾病患者的历史体征数据进行分析,获得 患者从健康状态到患病之前的体征变化趋势模型,然后使用该趋势模型对健 康人群的体征数据进行跟踪,一旦发现符合趋势模型的个体,就可以对他(她) 进行预警。实现该趋势模型的几个关键点在于:
1.历史体征数据的时间并不均匀一致。不同的人检查某一体征指标的时 间不固定,频率也不同。为了挖掘相关性需要对历史体征数据进行处理;
2.考虑每个个体不同的基础体征。不同的个体,其基础体征有一定的差 异,用整个人群的平均体征数据去衡量个体体征会有较大的误差。
3.具有噪音过滤的模型。个体体征数据具有周期性和随机性特征,在模 型中既要发现变化趋势,又要过滤掉这些噪音。
疾病g对应的体征指标A(具有较高灵敏度和特异性)的原始数据如表1:
表1:原始数据表orig
其中id字段为被跟踪人员的编号,发病时间为该人员在发现患病后估算得 到的初始发病时间,length字段表示该人员总共测量体征指标A的次数。每 个record[]字段都记录一次测量体征指标A的结果,每个record有测量时间 time和测量得到的值value两个域。其中time表示从格林威治时间1970年 01月01日00时00分00秒起至测量采样时为止的总秒数。
对原始数据的挖掘过程依次执行以下步骤:
参数变量定义:
orig:原始数据表;c_orig:时间序列体征数据表;
I:人员编号;Inter:时间间隔常数;
or=orig[i]:第i号人员的原始数据;cr=c_orig[i]:第i号人员的时间序列 体征数据;
or_p:当前人员在原始数据表中的第几次体检数据;
cr_p:当前人员在时间序列体征数据表中的第几个体征数据;
c_time:当前人员在时间序列体征数据表中的第cr_p个体征数据对应的 时间;
or.record[or_p].value:当前人员在原始数据表中的第or_p次体检数据;
cr.value[cr_p]:当前人员在时间序列体征数据表中的第cr_p个体征数据;
or.record[or_p].time:当前人员在原始数据表中的第or_p次的体检时间;
next_ov、base:临时变量;p、q:常量,其中p为长期均线周期数,q 为短期均线周期数,且p>q;
cr.length:当前人员在时间序列体征数据表中的体征数据个数;
or.length:当前人员在原始数据表中的体检个数;
or.ill_time:当前人员在原始数据表中的发病时间;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创业软件股份有限公司,未经创业软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711307752.2/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置