[发明专利]一种基于云计算平台的大数据处理方法在审
申请号: | 201610255657.1 | 申请日: | 2016-04-21 |
公开(公告)号: | CN105930463A | 公开(公告)日: | 2016-09-07 |
发明(设计)人: | 范东来;何宏靖 | 申请(专利权)人: | 成都数联铭品科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610041 四川省成都市高新区*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及互联网信息处理技术领域,特别涉及一种基于云计算平台的大数据处理方法,根据不同数据记录中所包含的相同信息单元,应用云计算平台下的大数据处理框架抽象出目标信息的关联信息。云计算平台的大数据处理框架例如Hadoop体系下的MapReduce和Spark等,通过将任务自动切分,分配到多个节点处理,分而自治的方式,可以实现海量数据的并行的处理,极大的提高了数据的处理效率。本发明采用大数据处理框架可以在纷繁复杂的互联网信息中,根据需要分析出海量目标信息背后隐含的关联信息;为数据信息的深度挖掘和应用提供了可靠便捷的途径,为目标背景分析,市场推广,市场细分,风险预测和防控等提供了有效技术支撑。 | ||
搜索关键词: | 一种 基于 计算 平台 数据处理 方法 | ||
【主权项】:
一种基于云计算平台的大数据处理方法,其特征在于,包含以下实现过程:(1)在一条数据记录中包含第一信息和第二信息,其中第二信息为第一信息的一度关联信息;(2)在第二数据记录中包括第二信息和第三信息,其中第三信息是第二信息的一度关联信息;通过云计算平台下的分布式处理框架将所述第三信息抽象成第一信息的二度关联信息;(3)在第三数据记录中包含第四信息和第三信息,其中所述第四信息为第三信息的一度关联信息,通过云计算平台下的分布式处理框架将所述第四信息抽象成第一信息的三度关联信息;依次类推,抽象出第一信息的N度关联信息,其中N≥1。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都数联铭品科技有限公司,未经成都数联铭品科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610255657.1/,转载请声明来源钻瓜专利网。