[发明专利]流感预测模型的生成方法、装置及计算机可读存储介质在审
申请号: | 201810543750.1 | 申请日: | 2018-05-31 |
公开(公告)号: | CN108831561A | 公开(公告)日: | 2018-11-16 |
发明(设计)人: | 李弦;徐亮;阮晓雯;肖京 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G16H50/80 | 分类号: | G16H50/80 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 候选特征 预测模型 流感 预测 计算机可读存储介质 小波去噪处理 集合 目标区域 数据序列 特征集合 预设 关键词获取 模型参数 趋势处理 生成装置 时间单元 算法构建 训练样本 准确度 构建 匹配 筛选 | ||
1.一种流感预测模型的生成方法,其特征在于,所述方法包括:
确定待预测的目标区域以及与流感预测匹配的舆情关键词,根据所述舆情关键词获取所述目标区域在连续多个时间单元内的舆情数据序列,并将所述舆情数据序列中的舆情数据作为候选特征,构建候选特征集合;
对所述候选特征集合中的候选特征进行小波去噪处理;
对经过小波去噪处理后的候选特征集合中的候选特征进行去趋势处理,获取去趋势处理后的候选特征集合;
确定特征的预设数量,并从候选特征集合中筛选出等于所述预设数量的候选特征,构成预测特征集合;
获取所述连续多个时间单元内的流感样病例百分比的实际观测值,根据所述预测特征集合和所述实际观测值作为训练样本,训练基于xgboost算法构建的预测模型以确定模型参数,并将确定了模型参数的所述预测模型作为流感预测模型。
2.如权利要求1所述的流感预测模型的生成方法,其特征在于,所述对所述候选特征集合中的候选特征进行小波去噪处理的步骤包括:
确定小波基函数,按照所述小波基函数对所述候选特征集合中的每个特征形成的序列进行小波分解,并确定分解层数;
确定小波去噪的阈值,按照确定的阈值对小波分解后的预测特征的各层次的系数进行调整;
对调整过的小波系数做逆变换重构,得到去噪之后的候选特征。
3.如权利要求1所述的流感预测模型的生成方法,其特征在于,所述对经过小波去噪处理后的候选特征集合中的候选特征进行去趋势处理,获取去趋势处理后的候选特征集合的步骤包括:
针对小波去噪处理后的候选特征集合中每个时间单元对应的候选特征,获取该时间单元之前的连续多个时间单元的数据进行线性回归,以构建趋势预测模型,根据所述趋势预测模型获取该时间单元对应的基线预测值;
使用该时间单元的候选特征的实际值减去所述基线预测值,得到去趋势之后的候选特征。
4.如权利要求1至3中任一项所述的流感预测模型的生成方法,其特征在于,所述确定特征的预设数量的步骤包括:
基于xgboost算法构建模型作为学习器,将所述候选特征集合中的候选特征输入所述学习器,使用特征递归消除交叉验证算法选择模型性能达到预设条件时的特征数量作为所述预设数量。
5.如权利要求4所述的流感预测模型的生成方法,其特征在于,所述从候选特征集合中筛选出等于所述预设数量的候选特征,构成预测特征集合的步骤包括:
基于xgboost算法构建模型作为学习器,将所述候选特征集合中的候选特征输入所述学习器,并按照特征递归消除算法进行迭代运算;
获取所述学习器经过运算返回的模型系数,根据所述模型系数确定每个候选特征集合中各候选特征的重要程度;
根据各候选特征的重要程度从当前的候选特征集合中移除重要程度最小的K个候选特征;
重复执行上述步骤,直至筛选得到的候选特征的数量达到所述预设数量;
所述预设数量的候选特征构成预测特征集合。
6.一种流感预测模型的生成装置,其特征在于,所述装置包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的模型生成程序,所述模型生成程序被所述处理器执行时实现如下步骤:
确定待预测的目标区域以及与流感预测匹配的舆情关键词,根据所述舆情关键词获取所述目标区域在连续多个时间单元内的舆情数据序列,并将所述舆情数据序列中的舆情数据作为候选特征,构建候选特征集合;
对所述候选特征集合中的候选特征进行小波去噪处理;
对经过小波去噪处理后的候选特征集合中的候选特征进行去趋势处理,获取去趋势处理后的候选特征集合;
确定特征的预设数量,并从候选特征集合中筛选出等于所述预设数量的候选特征,构成预测特征集合;
获取所述连续多个时间单元内的流感样病例百分比的实际观测值,根据所述预测特征集合和所述实际观测值作为训练样本,训练基于xgboost算法构建的预测模型以确定模型参数,并将确定了模型参数的所述预测模型作为流感预测模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810543750.1/1.html,转载请声明来源钻瓜专利网。