[发明专利]Impala基于Hadoop集群日志分析方法和系统有效
申请号: | 201610385810.2 | 申请日: | 2016-06-03 |
公开(公告)号: | CN106021580B | 公开(公告)日: | 2019-12-20 |
发明(设计)人: | 肖松林 | 申请(专利权)人: | 用友网络科技股份有限公司 |
主分类号: | G06F16/18 | 分类号: | G06F16/18;G06F16/182;G06F16/22 |
代理公司: | 11249 北京中恒高博知识产权代理有限公司 | 代理人: | 宋敏 |
地址: | 100094 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种Impala基于Hadoop集群日志分析方法和系统,其中,Impala基于Hadoop集群日志分析方法,包括,设置web服务器每天产生一个新的目录,目录下面产生多个由Application业务系统产生的日志文件的步骤;设置系统定时器CRON,定时向Hadoop中的HDFS导入前一天产生的日志文件,并加载日志文件数据到hive中的步骤;hive数据加载完成后,再次设置系统定时器CRON,定时更新hive元数据,启动Impala查询程序,提取hive元数据并计算统计指标的步骤;完成上述计算统计后,再次设置系统定时器CRON,定时从HDFS导出统计指标数据到数据库,方便以后查询的步骤。实现提高数据处理效率的优点。 | ||
搜索关键词: | impala 基于 hadoop 集群 日志 分析 方法 系统 | ||
【主权项】:
1.一种Impala基于Hadoop集群日志分析方法,其特征在于,包括,/n设置web服务器每天产生一个新的目录,目录下面产生多个由Application业务系统产生的日志文件的步骤;设置web服务器每天产生一个新的目录,目录下面产生多个由Application业务系统产生的日志文件的步骤中,每个日志文件的大小为64M;/n设置系统定时器CRON,定时向Hadoop中的HDFS导入前一天产生的日志文件,并加载日志文件数据到hive中的步骤;设置系统定时器CRON,定时向Hadoop中的HDFS导入前一天产生的日志文件中,系统定时器CRON设置为夜间0点以后;/nhive数据加载完成后,再次设置系统定时器CRON,定时更新hive元数据,启动Impala查询程序,提取hive元数据并计算统计指标的步骤;/n完成上述计算统计后,再次设置系统定时器CRON,定时从HDFS导出统计指标数据到数据库,方便以后查询的步骤。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于用友网络科技股份有限公司,未经用友网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610385810.2/,转载请声明来源钻瓜专利网。