[发明专利]一种基于SQL的文本数据统计实现方法有效
申请号: | 201510657159.5 | 申请日: | 2015-10-12 |
公开(公告)号: | CN105335479B | 公开(公告)日: | 2018-11-23 |
发明(设计)人: | 王洋;蒋旭;陈训逊;赵殿奎;吴震;谭炜波;赵旭;李晓鹏 | 申请(专利权)人: | 国家计算机网络与信息安全管理中心;天津神舟通用数据技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 天津盛理知识产权代理有限公司 12209 | 代理人: | 王利文 |
地址: | 100029*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于SQL的文本数据统计实现方法,其技术特点是:对输入SQL语法进行解析;在结构化数据仓库中建立和子查询投影结构一致的临时表;识别全文索引引擎数据分布规则;将基于SQL的简单子查询翻译为全文索引引擎语法,并在全文索引引擎中执行;获取全文索引查询结果并将结果导入到结构化数据仓库引擎临时表中;完成查询结果导入过程,向数据仓库下发重写后的基于临时表SQL查询语句,并向客户端返回查询结果。本发明结合全文索引引擎和结构化数据仓库引擎的特点,实现对海量文本数据的基于通用SQL语言的统计分析方法,解决了传统方法统计功能薄弱和结构化数据仓库无法支持高效文本检索的问题,大大提高了文本数据统计分析的易用性。 | ||
搜索关键词: | 一种 基于 sql 文本 数据 统计 实现 方法 | ||
【主权项】:
1.一种基于SQL的文本数据统计实现方法,其特征在于:构建基于一个文本统计协调器和多个文本统计执行器的分布式文本数据统计集群系统,所述文本统计协调器包括统一元数据管理模块、查询优化模块、SQL语法解析模块、结构化数据仓库SQL执行模块、分布式通信模块;所述文本统计执行器包括SQL语法向全文检索语义翻译模块、全文检索结果向结构化数据仓库导入模块,并且通过如下步骤实现:步骤1:文本统计协调器对输入SQL语法进行解析,提取所有存储在全文索引引擎中数据的子查询;步骤2:文本统计协调器在结构化数据仓库中建立和子查询投影结构一致的临时表,并将原查询语句的子查询部分重写为基于临时表的查询;步骤3:文本统计协调器通过获取分布式全文索引引擎的数据分布规则,下发分布式检索查询和数据仓库导入请求;步骤4:文本统计执行器将文本统计协调器下发请求中基于SQL的简单子查询翻译为全文索引引擎语法,并在全文索引引擎中执行;步骤5:文本统计执行器获取全文索引查询结果,并将结果导入到结构化数据仓库引擎临时表中;步骤6:文本统计协调器等待每个文本统计执行器完成查询结果导入过程,待导入结束后向数据仓库下发重写后的基于临时表SQL查询语句,并向客户端返回查询结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心;天津神舟通用数据技术有限公司,未经国家计算机网络与信息安全管理中心;天津神舟通用数据技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510657159.5/,转载请声明来源钻瓜专利网。
- 上一篇:用户数据导入方法及系统
- 下一篇:图片播放方法和装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置