[发明专利]知识库构建方法、装置和知识搜索方法、系统在审
申请号: | 202010373034.0 | 申请日: | 2020-05-06 |
公开(公告)号: | CN111626568A | 公开(公告)日: | 2020-09-04 |
发明(设计)人: | 何原荣;陈秋瑾;苏群;冷鹏;何婷婷 | 申请(专利权)人: | 厦门理工学院 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q50/26;G06N5/02;G06F16/35;G06F16/951 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郭锦辉;陈艺琴 |
地址: | 361000 福*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 知识库 构建 方法 装置 知识 搜索 系统 | ||
1.一种自然灾害领域知识库构建方法,其特征在于,包括:
构建自然灾害领域的基础数据库;
获取灾害文本数据;
采用类机器学习方法从所述灾害文本数据中提取结构化灾害数据;
按照预设分类对所述结构化灾害数据进行分类处理,得到灾害分类处理结果;
采用数据分析算法对所述结构化灾害数据进行挖掘分析,得到灾害挖掘分析结果;
整合与自然灾害相关的监测系统,从所述检测系统中提取自然灾害监测数据;
基于所述灾害文本数据、所述结构化灾害数据、所述灾害分类处理结果、所述灾害挖掘分析结果以及所述监测数据对所述基础数据库进行扩展,形成自然灾害领域知识库。
2.根据权利要求1所述的方法,其特征在于,所述获取灾害文本数据包括:
确定预设灾害关键字;
采用分布式爬虫技术和/或增量式爬虫技术从目标网站中获取与所述预设灾害关键字相匹配的原始文本数据;
对所述原始文本数据进行预处理,得到灾害文本数据。
3.根据权利要求2所述的方法,其特征在于,所述对所述原始文本数据进行预处理,得到灾害文本数据包括:
对所述原始文本数据进行文本内容抽取、数据清洗和去重、翻译、语义识别以及词性识别,得到灾害文本数据。
4.根据权利要求1或2所述的方法,其特征在于,所述采用类机器学习方法从所述灾害文本数据中提取结构化灾害数据包括:
获取所述灾害文本数据的关键字;
确定所述灾害文本数据的标签;
根据所述关键字和所述标签,从结构化规则库中获取结构化规则;
根据所述结构化规则从所述灾害文本数据中提取结构化灾害数据。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
从自定义的样本数据中自动提取结构化规则,将所述结构化规则保存在所述结构化规则库中。
6.根据权利要求1所述的方法,其特征在于,所述整合与自然灾害相关的监测系统包括:
整合台风监测系统。
7.一种自然灾害领域知识搜索方法,其特征在于,包括:
根据用户输入的搜索词,获得与所述搜索词匹配的关键字;
通过知识库获得与所述关键字匹配的数据;
将所述数据发送给用户;
其中,所述知识库包括基于灾害文本数据、由类机器学习方法从灾害文本数据中提取的结构化灾害数据、灾害分类处理结果、灾害挖掘分析结果以及监测数据对基础知识库进行扩展,所形成的自然灾害领域知识库。
8.一种自然灾害领域知识库构建装置,其特征在于,包括:初始化模块、数据爬取模块、数据处理模块、数据分类模块、数据分析模块、系统整合模块以及知识库扩展模块;
所述初始化模块用于构建自然灾害领域的基础数据库;
所述数据爬取模块用于获取灾害文本数据;
所述数据处理模块用于采用类机器学习方法从所述灾害文本数据中提取结构化灾害数据;
所述数据分类模块用于按照预设分类对所述结构化灾害数据进行分类处理,得到灾害分类处理结果;
所述数据分析模块用于采用数据分析算法对所述结构化灾害数据进行挖掘分析,得到灾害挖掘分析结果;
所述系统整合模块用于整合与自然灾害相关的监测系统,从所述检测系统中提取自然灾害监测数据;
所述知识库扩展模块用于基于所述灾害文本数据、所述结构化灾害数据、所述灾害分类处理结果、所述灾害挖掘分析结果以及所述监测数据对所述基础数据库进行扩展,形成自然灾害领域知识库。
9.根据权利要求8所述的装置,其特征在于,所述知识库扩展模块还用于从自定义的样本数据中自动提取结构化规则,将所述结构化规则保存在所述结构化规则库中。
10.一种自然灾害领域知识搜索系统,其特征在于,包括:
查询模块,用于根据用户输入的搜索词,获得与所述搜索词匹配的关键字;
搜索模块,用于通过知识库获得与所述关键字匹配的数据;
输出模块,用于将所述数据发送给用户;
其中,所述知识库通过知识库构建模块构建,所述知识库构建模块用于基于灾害文本数据、由类机器学习方法从灾害文本数据中提取的结构化灾害数据、灾害分类处理结果、灾害挖掘分析结果以及监测数据对基础知识库进行扩展,形成自然灾害领域知识库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门理工学院,未经厦门理工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010373034.0/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理