[发明专利]气象灾情数据语义识别分析方法和系统在审
| 申请号: | 202110163644.2 | 申请日: | 2021-02-05 |
| 公开(公告)号: | CN112818668A | 公开(公告)日: | 2021-05-18 |
| 发明(设计)人: | 王强;潘顺;杨辰;李海宏;顾宇丹 | 申请(专利权)人: | 上海市气象灾害防御技术中心(上海市防雷中心) |
| 主分类号: | G06F40/242 | 分类号: | G06F40/242;G06F40/289;G06F40/30;G06F16/35;G06K9/62 |
| 代理公司: | 上海唯源专利代理有限公司 31229 | 代理人: | 曾耀先 |
| 地址: | 201399 上*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 气象 灾情 数据 语义 识别 分析 方法 系统 | ||
1.一种气象灾情数据语义识别分析方法,其特征在于,包括:
灾种识别,建立由各灾种组成的灾种关键词字典,用于对案件发生情况描述进行识别匹配得到灾种字段;
地址识别,建立小区名字典和道路名字典,用于对案件发生地址描述进行识别匹配得到小区名称和道路名称字段;
程度识别,在灾种为暴雨的事件中,对积水深度的描述,采用提取关键词或者正则匹配方法将其转化为定量描述,构成积水深度字段;
信息抽取,建立基于词向量的线性支持向量机分类模型,对案件发生情况描述进行分词后再进行文本分类,得到直接影响类型。
2.如权利要求1所述的气象灾情数据语义识别分析方法,其特征在于,还包括:依据得到的直接影响类型,构建关键词匹配规则,进一步识别直接承灾体、直接承灾体数量、间接承灾体、间接影响以及间接承灾体。
3.如权利要求1所述的气象灾情数据语义识别分析方法,其特征在于,所述灾种关键词字典根据重要性不同包含两级关键词字典,一级字典仅包含第一层关键词,二级字典包含第一层关键词和第二层关键词,其中:
第一层关键词代表对气象灾害本身的描述性词语;
第二层关键词代表对气象灾害所造成影响的描述性词语。
4.如权利要求3所述的气象灾情数据语义识别分析方法,其特征在于,在灾种识别中,先识别第一层关键词再识别第二层关键词,同层不同灾种关键词按照重要性由低到高顺序识别,且后识别的灾种替换先识别的灾种。
5.如权利要求4所述的气象灾情数据语义识别分析方法,其特征在于,在地址识别中,根据案件发生地址描述内容,识别案件所属区县,并调用地名地址服务,获取该地址的经纬度信息并输出,根据经纬度点位数据与街道图层进行地理空间匹配,提取每个点位数据对应的街道信息并输出。
6.如权利要求1所述的气象灾情数据语义识别分析方法,其特征在于,在灾情事件情况描述文字中,按照积水深度的描述规律,包括数字描述类和物体描述类,其中:
对于数字描述类,建立积水深度正则匹配表达式字典,采用正则匹配的方式识别数字和单位,并且通过单位转换得到以厘米为计量单位的积水深度数值;
对于物体描述类,通过收集整理常用的描述物体字典,包含和身体有关的表述和汽车有关的表述,并查阅普通成年人身高参数及普通轿车参数,给出积水深度的定量描述字典,得到以厘米为计量单位的积水深度数值。
7.如权利要求6所述的气象灾情数据语义识别分析方法,其特征在于,在识别出积水深度的案件中,还包括按照识别水深从高到低排序,得到水深超出正常范围的异常水深,对异常水深的案件进行数据校验。
8.如权利要求1所述的气象灾情数据语义识别分析方法,其特征在于,信息抽取的步骤包括:
在获得案件事件描述的数据集后,先对所有案件进行打标,制作模型的训练集;
将已经打标的案件按照一定比例分成训练集和验证集;
将内容分词后,用TF-IDF算法计算权重,制作词向量和标签一起作为线性支持向量机分类模型的输入;
针对不同灾种分别训练不同线性支持向量机算法模型,进行有监督的文本分类算法。
9.如权利要求1所述的气象灾情数据语义识别分析方法,其特征在于:还包括利用测试集数据对灾种识别的准确率进行验证。
10.一种气象灾情数据语义识别分析系统,其特征在于,该系统用于执行如权利要求1~9中任意一项所述的气象灾情数据语义识别分析方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海市气象灾害防御技术中心(上海市防雷中心),未经上海市气象灾害防御技术中心(上海市防雷中心)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110163644.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电动葫芦行程限位装置
- 下一篇:一种堆垛设备的件烟核对系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





