[发明专利]一种政务大数据超级搜索系统在审
申请号: | 201910980793.0 | 申请日: | 2019-10-16 |
公开(公告)号: | CN112667700A | 公开(公告)日: | 2021-04-16 |
发明(设计)人: | 张丹普;董雪梅 | 申请(专利权)人: | 北京航天长峰科技工业集团有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/36;G06F16/9535;G06Q50/26 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100854*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 政务 数据 超级 搜索 系统 | ||
本发明涉及一种政务大数据超级搜索系统,包括前端显示模块、超级搜索模块、数据治理模块、全息档案模块、数据存储模块;采用ElasticSearch+MPP架构重点解决大规模结构化数据高效查询检索问题,能够高效实现关键词全文检索、拼音检索、范围检索、逻辑组合检索和人像检索,并可对搜索结果的显示字段灵活配置,解决现有检索方式检索查询效率慢、检索数据种类少、检索范围不足以及搜索结果显示修改难等问题,同时结合MPP DB、HDFS、Neo4j多类型数据存储模式,可实现搜索结果详情信息的快速全面查询查看。
技术领域
本发明属于大数据检索技术领域,涉及一种基于ElasticSearch和MPPDB的政务大数据超级搜索系统。
背景技术
大数据是信息化发展的新阶段。随着信息技术和人类生产生活交汇融合,互联网快速普及,全球数据呈现爆发增长、海量集聚的特点,对经济发展、社会治理、国家管理、人民生活都产生了重大影响。实施国家大数据战略加快建设数字中国,要构建以数据为关键要素的数字经济,建设现代化经济体系离不开大数据发展和应用。
所谓政务大数据,是指政府推动大数据应用发展的过程或大数据在公共服务领域的应用实践。但各级政府在推动政务大数据应用方面,仍存在不少问题,其中多源异构海量大规模数据的快速、高效、精准的查询检索一直是大数据应用的一大难题。
政务大数据搜索,是指根据数据特征,如关键字、语意、内容、人像等对大数据集合进行检索、分类、筛选、过滤和排序等。政府部门数据检索早期主要依赖基于SQL的数据库检索,随着数据量的增加,逐渐发展到基于Solr的全文检索,然而,在大数据时代,随着信息爆炸,当数据规模达到一定程度时,Solr的搜索效率会变得很低,而ElasticSearch是一个实时分布式搜索和分析引擎,面向大规模数据搜索基于ElasticSearch的搜索效率较高,并且更容易处理大型索引和高查询率。
发明内容
本发明的目的在于克服现有技术的不足,提供一种政务大数据超级搜索系统,能够高效实现关键词全文检索、拼音检索、范围检索、逻辑组合检索和人像检索,并可对搜索结果的显示字段灵活配置,解决现有检索方式检索查询效率慢、检索数据种类少、检索范围不足以及搜索结果显示修改难等问题。
本发明的技术方案如下:
一种政务大数据超级搜索系统,其特征在于:包括前端显示模块、超级搜索模块、数据治理模块、全息档案模块、数据存储模块;
所述前端显示模块是针对关键字检索、拼音检索、逻辑组合检索、图片检索等提供统一搜索入口,根据不同部门、不同类别提供搜索结果展示及筛选,并支持查看全息档案;
所述超级搜索模块是基于ElasticSearch全文检索引擎,构建全文索引库,提供解析器、图像识别、分词器、查询器、范围检索、拼音检索、逻辑组合检索、对外接口等功能;
所述数据治理模块是提供元数据管理、字典管理、资源目录、资源项配置等功能;
所述全息档案模块是通过搜索目标结果列表,提供快速查看目标对象基本信息、轨迹信息、关系图谱及其他信息等功能;
所述数据存储模块是基于MPP DB构建数据仓库,基于HDFS完成图片存储,Neo4j高性能图数据库存储目标对象的实体和关系信息,实现全量数据存储。
本发明可支持精确和模糊的关键字查询、人像比对、车辆比对、拼音查询、范围查询、逻辑组合查询,提供多种类查询方式统一入口,可灵活配置查询范围,可支持搜索目标的详情查看,快速查看搜索目标的全息档案,实现政务大数据查的快、查的准、查的全,显著提升全文检索效率。
附图说明
图1是本发明的功能模块及系统流程图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航天长峰科技工业集团有限公司,未经北京航天长峰科技工业集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910980793.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:端面打磨装置
- 下一篇:基于马尔科夫聚类算法的动态聚类方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置