[发明专利]数据打标方法、处理方法以及装置在审
申请号: | 201910777419.0 | 申请日: | 2019-08-22 |
公开(公告)号: | CN110555076A | 公开(公告)日: | 2019-12-10 |
发明(设计)人: | 杨涵冰;吴豪;刘倩;万鹏 | 申请(专利权)人: | 上海数禾信息科技有限公司 |
主分类号: | G06F16/27 | 分类号: | G06F16/27;G06F16/28;G06F16/2455;G06F16/907 |
代理公司: | 11541 北京卓唐知识产权代理有限公司 | 代理人: | 唐海力 |
地址: | 200120 上海市浦东新区中国(上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请公开了一种数据打标方法、处理方法以及装置。该数据打标方法包括将数据集群中预设数据源产生的预设标签消息数据按照分布式流处理操作,生成实时标签;从数仓中获取已完成打标作业的离线标签;将所述实时标签和所述离线标签分别存储至HBase分布式数据库。本申请解决了数据打标效果不佳的技术问题。通过本申请能够提供实时标签,同时能够实时向下游反馈标签内容的变化结果。此外,本申请适用于大数据集群架构。 | ||
搜索关键词: | 标签 数据打 申请 离线 分布式流处理 分布式数据库 变化结果 标签内容 标签消息 集群架构 数据集群 预设数据 大数据 打标 预设 存储 反馈 | ||
【主权项】:
1.一种数据打标方法,其特征在于,包括:/n将数据集群中预设数据源产生的预设标签消息数据按照分布式流处理操作,生成实时标签;/n从数仓中获取已完成打标作业的离线标签;/n将所述实时标签和所述离线标签分别存储至HBase分布式数据库。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海数禾信息科技有限公司,未经上海数禾信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910777419.0/,转载请声明来源钻瓜专利网。