[发明专利]流感预测模型的生成方法、装置及计算机可读存储介质在审
申请号: | 201810543750.1 | 申请日: | 2018-05-31 |
公开(公告)号: | CN108831561A | 公开(公告)日: | 2018-11-16 |
发明(设计)人: | 李弦;徐亮;阮晓雯;肖京 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G16H50/80 | 分类号: | G16H50/80 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 候选特征 预测模型 流感 预测 计算机可读存储介质 小波去噪处理 集合 目标区域 数据序列 特征集合 预设 关键词获取 模型参数 趋势处理 生成装置 时间单元 算法构建 训练样本 准确度 构建 匹配 筛选 | ||
本发明公开了一种流感预测模型的生成方法,该方法包括:确定待预测的目标区域以及与流感预测匹配的舆情关键词,根据舆情关键词获取目标区域在连续多个时间单元内舆情数据序列,并将舆情数据序列中的舆情数据作为候选特征构建候选特征集合;对候选特征进行小波去噪处理;对经过小波去噪处理后的候选特征集合中的候选特征进行去趋势处理;确定特征的预设数量,从候选特征集合中筛选出等于预设数量的特征构成预测特征集合;根据预测特征集合作为训练样本训练基于xgboost算法构建的预测模型以确定模型参数。本发明还提出一种流感预测模型的生成装置以及一种计算机可读存储介质。本发明提高了流感预测模型的预测准确度。
技术领域
本发明涉及计算机技术领域,尤其涉及一种流感预测模型的生成方法、装置及计算机可读存储介质。
背景技术
随着人工智能技术的发展,通过监测网络数据源发现公共健康事件的相关研究数量增多,尤其是搜索服务提供商等持有大量用户行为数据的公司在这一方向上做出了许多尝试,学术界亦有相关的研究跟进。但流感预测模型的预测精度仍然有限,主要原因在于,舆情数据波动大、趋势变化易受平台用户使用量影响是造成利用舆情数据进行流感预测建模效果受限的主要原因之一,比如,微博近几年的用户量急剧减少,微博因子整体趋势随之呈下降趋势,这种趋势变化影响了预测的准确度。目前已有的基于舆情的流感预测并未针对舆情因子波动大和趋势变化问题进行处理,而是使用简单的线性回归或随机森林等方法对舆情因子建模进行流感预测,导致流感预测准确度较低。
发明内容
本发明提供一种流感预测模型的生成方法、装置及计算机可读存储介质,其主要目的在于提高流感预测模型的预测准确度。
为实现上述目的,本发明还提供一种流感预测模型的生成方法,该方法包括:
确定待预测的目标区域以及与流感预测匹配的舆情关键词,根据所述舆情关键词获取所述目标区域在连续多个时间单元内的舆情数据序列,并将所述舆情数据序列中的舆情数据作为候选特征,构建候选特征集合;
对所述候选特征集合中的候选特征进行小波去噪处理;
对经过小波去噪处理后的候选特征集合中的候选特征进行去趋势处理,获取去趋势处理后的候选特征集合;
确定特征的预设数量,并从候选特征集合中筛选出等于所述预设数量的候选特征,构成预测特征集合;
获取所述连续多个时间单元内的流感样病例百分比的实际观测值,根据所述预测特征集合和所述实际观测值作为训练样本,训练基于xgboost算法构建的预测模型以确定模型参数,并将确定了模型参数的所述预测模型作为流感预测模型。
可选地,所述对所述候选特征集合中的候选特征进行小波去噪处理的步骤包括:
确定小波基函数,按照所述小波基函数对所述候选特征集合中的每个特征形成的序列进行小波分解,并确定分解层数;
确定小波去噪的阈值,按照确定的阈值对小波分解后的预测特征的各层次的系数进行调整;
对调整过的小波系数做逆变换重构,得到去噪之后的候选特征。
可选地,所述对经过小波去噪处理后的候选特征集合中的候选特征进行去趋势处理,获取去趋势处理后的候选特征集合的步骤包括:
针对小波去噪处理后的候选特征集合中每个时间单元对应的候选特征,获取该时间单元之前的连续多个时间单元的数据进行线性回归,以构建趋势预测模型,根据所述趋势预测模型获取该时间单元对应的基线预测值;
使用该时间单元的候选特征的实际值减去所述基线预测值,得到去趋势之后的候选特征。
可选地,所述确定特征的预设数量的步骤包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810543750.1/2.html,转载请声明来源钻瓜专利网。