[发明专利]一种基于指数加权移动平均的症状相关性预警方法有效
申请号: | 201810954138.3 | 申请日: | 2018-08-21 |
公开(公告)号: | CN109003681B | 公开(公告)日: | 2022-02-08 |
发明(设计)人: | 粘冬晓;杜庆治;龙华;邵玉斌 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G16H50/80 | 分类号: | G16H50/80 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 650093 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 指数 加权 移动 平均 症状 相关性 预警 方法 | ||
本发明涉及一种基于指数加权移动平均的症状相关性预警算法,属于大数据分析领域。本发明具体是在建立症状发病量数据库、对采集到的症状信息进行筛选处理,根据所熟知症状的需求剔除不在其中的症状。传统的相关性算法只是对症状的发病数进行基本的平均值计算,忽略了在时间上的症状数据前后的影响。本文提出的基于指数加权移动平均的症状相关性预警算法,意在将经过指数加权后求得均值作为相关性算法的依据,这样将历史回顾性数据和当前数据想结合,使得到的相关性系数更为准确,再根据求得的相关性系数进行数据比较,找出数据的异常,得出预警的时间点以及预警的数据来源,从而达到更好的预警效果。
技术领域
本发明涉及一种基于指数加权移动平均的症状相关性预警方法,属于大数据分析领域。
背景技术
随着社会的发展,各种传染病肆虐着人类的身体,给无数的家庭带来了极大痛苦,并且随着社会的进步,人员流动水平和速度逐渐提升,也使得传染病在人们之间的扩散得以加剧,因此有很多部门做出传染病疫情预警的实施方案。对于症状相关性分析并没有数学的依据,结合实际,症状数量会有时间上的影响,但传统的相关性分析并没有添加这些协变量。
发明内容
本发明要解决的技术问题是提供一种基于指数加权移动平均的症状相关性预警方法,意在将经过指数加权后求得均值作为相关性算法的依据,再根据求得的相关性系数进行数据比较,找出数据的异常,得出预警的时间点以及预警的数据来源,从而达到更好的预警效果。
本发明采用的技术方案是:一种基于指数加权移动平均的症状相关性预警方法,包括如下步骤:
Step1:建立症状发病量的数据库:收集某地区某段时间内疾病的症状发病量情况,以每天作为一个基准窗口,建立一个时间序列上的症状发病量信息表,症状发病量信息表包括:编号,就诊时间,症状种类以及症状对应的发病数量;
Step2:症状数据预处理:对采集到的症状种类信息字段进行筛选,将症状种类信息字段与所需研究的症状进行对比,剔除掉与研究无关的症状数据以及无法识别的无用症状数据;
Step3:对症状进行指数加权移动平均计算:根据Step2筛选好的数据,选取第一个症状作为样本X,该症状对应的每日发病数量设为第二个症状作为样本Y,该症状对应的每日发病数量设为……以此类推,以样本X为例,通过按日期得到的症状数据以7天为一个基准窗口,即第一天到第七天的数据,得到第八天的指数加权移动平均值,第二天到第八天的数据,得到第九天的指数加权移动平均值,以此类推,这样就得到一系列指数加权移动平均值其中为第t天的指数加权移动平均值,同理可以得到样本Y的指数加权移动平均值
Step4:对症状进行相关性系数计算:通过step3得到的以7天为一个基准线的指数加权移动平均值以此作为协方差计算的均值,选取两种症状,例如:样本X和样本Y来计算两种症状之间的协方差,然后继续计算该两种症状之间的相关系数rxy,以此来衡量该两种症状相关性的密切程度;
Step5:对相关性系数集合进行可视化处理:通过对step4得到的一系列的rxy值进行画图显示,得到一个以7天为一个基准窗口的指数加权移动平均作为相关性系数均值的折线图,分析折线图的趋势找到异常点进行预警分析。
具体地,步骤Step3中,对Step3中两种症状即样本X和样本Y进行指数加权移动平均计算公式为:
其中为样本X,Y的第t天的指数加权移动平均值,λ为指数加权平均的阈值,λ=0.2或0.1,(1-λ)n的变量n取值从n=7开始,随着变量i增加一而减小一,直到i=t,n=1结束本次计算。
具体地,步骤Step4中,
协方差计算公式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810954138.3/2.html,转载请声明来源钻瓜专利网。