[发明专利]一种基于要素信息抽取的气象灾害事件聚合方法在审
| 申请号: | 202111651925.9 | 申请日: | 2021-12-30 | 
| 公开(公告)号: | CN114282534A | 公开(公告)日: | 2022-04-05 | 
| 发明(设计)人: | 赵文强;王铁;张雪英;王益鹏;曹忠群 | 申请(专利权)人: | 南京大峡谷信息科技有限公司 | 
| 主分类号: | G06F40/279 | 分类号: | G06F40/279;G06N20/00;G06F16/35 | 
| 代理公司: | 南京锐恒专利代理事务所(普通合伙) 32506 | 代理人: | 陈思 | 
| 地址: | 210046 江苏省南京市栖霞区*** | 国省代码: | 江苏;32 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 基于 要素 信息 抽取 气象 灾害 事件 聚合 方法 | ||
本发明公开了一种基于要素信息抽取的气象灾害事件聚合方法。本发明通过分析气象灾害事件信息在自然语言与气象灾害事件信息系统中表达机制差异,归纳总结气象灾害信息的语言描述特点,构建面向中文文本的气象灾害信息表达体系,并制定具体的标注模式和规范,建立大规模的中文文本标注实验数据,以供机器学习进行灾害事件信息中相关信息的抽取;根据气象灾害信息来源发布特点,选取合适所需信息源进行数据采集,制定自动化采集方法,以获取气象灾害事件的文本数据;随后根据标注数据,结合机器学习算法与模型,对气象灾害事件信息中的时间信息、地名信息、事物信息、人物信息和事件信息进行抽取;以抽取的时间、地名、事物、人物和事件信息作为基础,根据构建的气象灾害特征词库以及抽取信息中的灾害时间范围、灾害地点、受灾详情以及事物关键词和灾情信息阈值等数据,结合事件聚合流程和判断逻辑,将同一气象灾害事件的信息进行聚合。
技术领域
本发明涉及一种基于要素信息抽取的气象灾害事件聚合方法,属于气象灾害 监测技术领域。
背景技术
气象灾害是指大气对人类的生命财产和国民经济建设及国防建设等造成的 直接或间接的损害,主要包括台风、干旱、高温、山洪、雷暴、沙尘暴等。中 国是世界上自然灾害发生十分频繁、灾害种类甚多,造成损失十分严重的少数 国家之一。气象防灾减灾救灾是气象工作的重中之重,是国家防灾减灾救灾不 可替代的重要力量,是国家公共安全体系的重要组成部分。
实践表明,气象实况数据、预报数据和舆情监测数据存在显著的优势互补特 性。与其他气象数据相比,虽然网络气象舆情数据存在稀疏性、不确定性、模 糊性等缺点,但是具有不可替代的多元性、丰富性、动态性和关联性等特征。 气象防灾减灾相关舆情信息收集和分析是气象服务工作重要成分。
舆情信息聚合是将各种数据来源中分散的相关信息碎片,围绕某个主题将其 整合成完整的、有参考价值的信息。可以分别以时间、地点、人物、事物、事 件为线索,进行气象灾害舆情信息聚合。例如,将台风“山竹”(事件)按照时 间和地点顺序进行聚合,能够系统地整理该事件从预报开始,直至事件结束所 有的信息,帮助人们全面地了解台风的整个生命周期及其导致的灾情信息。在 发明中,重点对文本信息进行聚合,结合信息抽取过程中对于气象灾害事件信 息的抽取结果,针对我国不同区域、不同时期气象灾害发生的类型和特点,通 过事件聚合流程和判断逻辑,对气象灾害舆情事件进行聚合,从而可实现气象灾害的整体分析,解决气象灾害监测的标准化、智能化问题。
发明内容
气象灾害的防灾减灾是国家公共安全体系的重要组成部分。气象舆情监测数 据存在稀疏性、不确定性、模糊性等缺点,针对我国不同区域、不同时期气象 灾害发生的类型和特点,利用信息聚合将其整合成完整的、有参考价值的信息 是本发明亟待解决的问题,本发明的目的在于提供一种基于要素信息抽取的气 象灾害事件聚合方法。
本发明解决其技术问题所采取的技术方案是:一种基于要素信息抽取的气象 灾害事件聚合方法,该方法包括以下步骤:
步骤1:通过分析气象灾害事件信息在自然语言与气象灾害事件信息系统中 表达机制差异,归纳总结气象灾害信息的语言描述特点,构建面向中文文本的 气象灾害信息表达体系,并制定具体的标注模式和规范,建立大规模的中文文 本标注实验数据,以供机器学习进行灾害事件信息中相关信息抽取的训练;
步骤2:参考气象灾害信息的发布特点,选取所需信息源进行访问,拟采用 基于链接结构评价的搜索策略和基于网页内容评价的搜索策略两种方式的气象 灾害事件信息资源网页获取策略以获取灾害舆情信息的新闻文本数据;
步骤3:利用舆情信息中灾害事件标注语料完成训练的机器学习和深度学习 信息抽取模型,结合本发明构建的气象灾害事件的特征词汇库,进行舆情信息 中的数据抽取,包括时间、地名、人物、事物和气象灾害事件信息的抽取;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大峡谷信息科技有限公司,未经南京大峡谷信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111651925.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种杨梅采后保鲜的减药处理方法
- 下一篇:一种动铁芯自动铆压、打磨生产线
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





