[发明专利]一种hadoop环境下的数据处理方法在审
申请号: | 201810402034.1 | 申请日: | 2018-04-28 |
公开(公告)号: | CN108595663A | 公开(公告)日: | 2018-09-28 |
发明(设计)人: | 王海风;王书勤;张红昌 | 申请(专利权)人: | 尚谷科技(天津)有限公司;王海风;王书勤;张红昌 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 天津市尚文知识产权代理有限公司 12222 | 代理人: | 张东浩 |
地址: | 300457 天津市滨海新区天津开发区信环西路19号泰达服*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种hadoop环境下的数据处理方法建立多个数据字典索引,根据用户的需求依靠多个数据字典索引选取合适的数据字典;通过标识符模式搭建hadoop环境下的物理模型库,按照用户的需求提取逻辑数据,对提取的逻辑数据实施自然语言解析,采用数据投影的方式处理解析后的数据得到投影数据用于完成数据判断,并展示数据判断结果。该方法能够将待调度数据节点的处理负荷分担至目标数据节点,减轻SQL on hadoop系统中数据分布不均匀的问题,提升系统性能。 | ||
搜索关键词: | 数据字典 逻辑数据 数据处理 索引 标识符 自然语言解析 待调度数据 处理负荷 方式处理 目标数据 判断结果 数据分布 数据判断 数据投影 提升系统 投影数据 物理模型 需求提取 展示数据 不均匀 解析 分担 | ||
【主权项】:
1.一种hadoop环境下的数据处理方法,其特征在于,包括如下特点:建立多个数据字典索引,根据用户的需求依靠多个数据字典索引选取合适的数据字典;通过标识符模式搭建hadoop环境下的物理模型库,按照用户的需求提取逻辑数据,对提取的逻辑数据实施自然语言解析,采用数据投影的方式处理解析后的数据得到投影数据用于完成数据判断,并展示数据判断结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于尚谷科技(天津)有限公司;王海风;王书勤;张红昌,未经尚谷科技(天津)有限公司;王海风;王书勤;张红昌许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810402034.1/,转载请声明来源钻瓜专利网。