[发明专利]基于人工智能的疫情预测方法、装置、存储介质及服务器在审
申请号: | 202111525060.1 | 申请日: | 2021-12-14 |
公开(公告)号: | CN114168835A | 公开(公告)日: | 2022-03-11 |
发明(设计)人: | 宋威 | 申请(专利权)人: | 平安国际智慧城市科技股份有限公司 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/33;G06N3/04;G06N3/08;G16H50/80 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 刘永康 |
地址: | 518000 广东省深圳市前海深港合*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人工智能 疫情 预测 方法 装置 存储 介质 服务器 | ||
1.一种基于人工智能的疫情预测方法,其特征在于,包括:
根据预设的疫情关键词从互联网中爬取在预设的第一时段内与疫情相关的新闻文章序列;
使用预设的语言表征模型对所述新闻文章序列进行特征信息提取,得到与所述新闻文章序列对应的特征信息序列;
从预设的数据库中获取在所述第一时段内的疫情确诊人数序列;
对所述疫情确诊人数序列进行差分计算,得到与所述疫情确诊人数序列对应的差分序列;
使用预设的疫情预测模型对所述特征信息序列和所述差分序列进行预测分析,得到在预设的第二时段内的疫情确诊人数预测序列。
2.根据权利要求1所述的疫情预测方法,其特征在于,所述根据预设的疫情关键词从互联网中爬取在预设的第一时段内与疫情相关的新闻文章序列,包括:
根据所述疫情关键词从互联网中爬取在所述第一时段内与疫情相关的各篇新闻文章;
将爬取的各篇新闻文章按照发布日期划分为N个新闻文章集合;其中,N为所述第一时段的总天数,同一发布日期的新闻文章被划分至同一新闻文章集合中;
将划分的N个新闻文章集合按照发布日期升序排列,形成所述新闻文章序列。
3.根据权利要求2所述的疫情预测方法,其特征在于,所述使用预设的语言表征模型对所述新闻文章序列进行特征信息提取,得到与所述新闻文章序列对应的特征信息序列,包括:
使用所述语言表征模型对所述新闻文章序列中的各篇新闻文章分别进行特征信息提取,得到所述新闻文章序列中的各篇新闻文章的第一特征信息向量;
对第n个新闻文章集合中的各篇新闻文章的第一特征信息向量进行均值计算,得到第n个新闻文章集合的第二特征信息向量,1≤n≤N;
将所述新闻文章序列中的各个新闻文章集合的第二特征信息向量按照发布日期升序排列,形成所述特征信息序列。
4.根据权利要求3所述的疫情预测方法,其特征在于,所述使用所述语言表征模型对所述新闻文章序列中的各篇新闻文章分别进行特征信息提取,得到所述新闻文章序列中的各篇新闻文章的第一特征信息向量,包括:
对目标新闻文章进行分割处理,得到所述目标新闻文章的符号序列;其中,所述目标新闻文章为所述新闻文章序列中的任意一篇新闻文章;
根据所述符号序列生成所述目标新闻文章的叠加序列;
从所述叠加序列中选取与预设的第一符号对应的向量作为所述目标新闻文章的第一特征信息向量。
5.根据权利要求4所述的疫情预测方法,其特征在于,所述根据所述符号序列生成所述目标新闻文章的叠加序列,包括:
分别生成与所述符号序列对应的词嵌入序列、分段嵌入序列和位置嵌入序列;其中,所述词嵌入序列中包括所述符号序列中各个符号的词向量,所述分段嵌入序列中包括所述符号序列中各个符号所属的分段信息,所述位置嵌入序列中包括所述符号序列中各个符号的位置信息;
对所述词嵌入序列、所述分段嵌入序列和所述位置嵌入序列进行叠加,生成所述叠加序列。
6.根据权利要求1所述的疫情预测方法,其特征在于,所述对所述疫情确诊人数序列进行差分计算,得到与所述疫情确诊人数序列对应的差分序列,包括:
根据下式分别计算所述第一时段内每天的疫情确诊人数变化率:
Rm=(Pm-Pm-1)/Pm-1
其中,Pm为所述第一时段内的第m天的疫情确诊人数,1≤m≤M,M为所述第一时段的总天数,Rm为所述第一时段内的第m天的疫情确诊人数变化率;
将所述第一时段内每天的疫情确诊人数变化率按照时间升序排列,形成所述差分序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安国际智慧城市科技股份有限公司,未经平安国际智慧城市科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111525060.1/1.html,转载请声明来源钻瓜专利网。