[发明专利]一种基于Spark的索引方法在审

申请号：	201911026342.X	申请日：	2019-10-26
公开（公告）号：	CN110737667A	公开（公告）日：	2020-01-31
发明（设计）人：	王帅	申请（专利权）人：	南京录信软件技术有限公司
主分类号：	G06F16/22	分类号：	G06F16/22;G06F16/2458;G06F16/27
代理公司：	暂无信息	代理人：	暂无信息
地址：	210000 江苏省南京***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于Spark的索引方法，包括如下步骤，S1：在Spark进程中通过自定义消费接口消费实时数据，数据通过索引接口建立索引；S2：修改lucene的原生索引接口；S3：将整个索引程序、查询接口与Spark的服务结合起来；S4：进行数据处理，之后进行数据的查询；主要是在原始的Spark检索上添加了一层索引功能，从而加快了检索性能；该功能在索引层使用的是原生的lucene，通过自定义接口，Spark或者离线程序会将数据索引到HDFS上面，以后的统计分析都可以使用Spark的索引查询快速返回，而在查询语言的使用上选择的是Spark SQL，本发明完美的与Spark SQL引擎结合在一起，这种基于结构化数据的查询语言简化了查询难度，降低了学习成本。
搜索关键词：	索引查询语言结构化数据自定义接口查询接口检索性能接口建立实时数据数据索引数据通过索引查询索引程序索引功能消费接口查询数据处理统计分析自定义离线检索返回进程学习服务
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于Spark的索引方法，其特征在于：包括如下步骤，/nS1：在Spark进程中通过自定义消费接口消费实时数据，数据通过索引接口建立索引；/nS2：修改lucene的原生索引接口；/nS3：将整个索引程序、查询接口与Spark的服务结合起来；/nS4：进行数据处理，之后进行数据的查询。/n

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南京录信软件技术有限公司，未经南京录信软件技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201911026342.X/，转载请声明来源钻瓜专利网。

上一篇：一种支持可运营电视预发布的方法
下一篇：数据存储方法、数据读取方法、相关设备及介质

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于Spark的索引方法在审

专利文献下载