[发明专利]数据抽取方法及基于地理信息的数据展示方法在审
申请号: | 201811058682.6 | 申请日: | 2018-09-11 |
公开(公告)号: | CN109271428A | 公开(公告)日: | 2019-01-25 |
发明(设计)人: | 左琦;巫禄成;刘彤;郭燕燕;代宝乾;汪彤;周扬凡;谢昱姝 | 申请(专利权)人: | 北京市计算中心;北京市劳动保护科学研究所 |
主分类号: | G06F16/248 | 分类号: | G06F16/248;G06F16/29;G06F16/242 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;吴欢燕 |
地址: | 100094 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 抽取规则 全文搜索引擎 目标数据 数据抽取 用户配置 抽取 计算机技术领域 基于地理信息 查询对象 格式组织 开发效率 开发周期 数据展示 索引数据 结构化 可配置 可视化 转换 检索 渲染 灵活 展示 开发 | ||
本发明提供一种数据抽取方法,属于计算机技术领域,该方法包括:获取用户配置的抽取规则;将所述抽取规则转换成SQL查询语句;根据所述SQL查询语句,从全文搜索引擎中抽取目标数据。另外,将抽取到的所述目标数据渲染到地图上,实现所述目标数据的可视化展示。本发明提供的数据抽取方法,通过将用户配置的抽取规则转换成结构化的SQL查询语句,避免了复杂的查询对象使用字符串格式组织,该方法灵活可配置,支持各个领域的抽取规则的定制,在全文搜索引擎中支持SQL查询语句,极大的方便了技术人员对全文搜索引擎中索引数据的检索,提高了开发效率,缩短了开发周期,降低了开发成本。
技术领域
本发明涉及计算机技术领域,尤其涉及一种数据抽取方法及基于地理信息的数据展示方法。
背景技术
在计算机技术领域,数据抽取是各行各业定制化自身业务的重要手段,如何可视化抽取数据也是业务需求的重要内容。
现有技术中的数据抽取方法,通常使用数据库模糊查询进行检索,当数据量增大时,检索速度越来越慢,而基于大数据搜索引擎进行数据抽取能极大提升数据抽取速度,现有方法中通常使用全文检索工具进行检索,将各种复杂的查询对象使用字符串格式组织,构建查询语句来抽取数据,以实现各业务需求。
但是现有技术中的方法存在如下技术问题:一是组装复杂的字符串格式对象查询语句用于从全文检索工具中抽取数据,极大的限制了开发效率;二是每次数据传输到全文检索工具中需要额外的调用接口,耦合性太高;三是全文检索工具自带的分词器的分词粒度太粗,造成抽取的数据的准确度不高,四是抽取的数据多数用于列表和报告展示,缺少丰富的可视化图表和地理信息展示支撑。
发明内容
本发明的目的是提供一种数据抽取方法及基于地理信息的数据展示方法,解决了现有技术中的上述技术问题。
为了解决上述技术问题,一方面,本发明提供一种数据抽取方法,包括:
获取用户配置的抽取规则;
将所述抽取规则转换成SQL查询语句;
根据所述SQL查询语句,从全文搜索引擎中抽取目标数据。
另一方面,本发明提供一种基于地理信息的数据展示方法,包括:
抽取目标数据,所述目标数据的抽取方法为上述的方法;
将所述目标数据渲染到地图上,实现所述目标数据的可视化展示。
再一方面,本发明提供一种数据抽取装置,包括:
获取模块,用于获取用户配置的抽取规则;
转换模块,用于将所述抽取规则转换成SQL查询语句;
抽取模块,用于根据所述SQL查询语句,从全文搜索引擎中抽取目标数据。
又一方面,本发明提供一种基于地理信息的数据展示装置,包括:
数据抽取模块,用于获取用户配置的抽取规则;将所述抽取规则转换成SQL查询语句;根据所述SQL查询语句,从全文搜索引擎中抽取目标数据;
展示模块,用于将所述目标数据渲染到地图上,实现所述目标数据的可视化展示。
又一方面,本发明提供一种数据库系统,包括数据库和数据抽取装置,其特征在于,所述数据抽取装置包括:
获取模块,用于获取用户配置的抽取规则;
转换模块,用于将所述抽取规则转换成SQL查询语句;
抽取模块,用于根据所述SQL查询语句,从全文搜索引擎中抽取目标数据。
又一方面,本发明提供一种电子设备,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市计算中心;北京市劳动保护科学研究所,未经北京市计算中心;北京市劳动保护科学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811058682.6/2.html,转载请声明来源钻瓜专利网。