[发明专利]一种数据标签方法和装置在审
申请号: | 201711033523.6 | 申请日: | 2017-10-30 |
公开(公告)号: | CN107844548A | 公开(公告)日: | 2018-03-27 |
发明(设计)人: | 谢永恒;童克冬;火一莽;万月亮 | 申请(专利权)人: | 北京锐安科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06N5/02 |
代理公司: | 北京品源专利代理有限公司11332 | 代理人: | 孟金喆 |
地址: | 100044 北京市海淀区西小口*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 标签 方法 装置 | ||
技术领域
本发明实施例涉及计算机大数据领域,尤其涉及一种数据标签方法和装置。
背景技术
随着大数据逐步走过了探索阶段、市场启动阶段,大数据已经进入从概念到实际应用的关键转折期。大数据在接受度、技术、应用等各个方面趋于成熟,开始步入产业的快速发展阶段。大数据巨大的应用价值带动了大数据行业的迅速发展。
随着各类行业大数据整合的逐步推进,许多问题有待解决,如:如何从海量数据中有效提炼有效信息和整合数据?如何基于已有的数据分析技能自助式地灵活分析和应用知识?如何将自身业务经验数字化,将经验转化为知识?数据分析人员如何基于业务经验积累进行数据创新和迭代优化?数据不等于知识,如果缺乏有效的“知识”提炼和整合,用户将快速淹没在海量数据中。因此,一种可以从海量数据中有效提取和整合数据,并以标签形式为基础构建的管理工具有待提出。
发明内容
本发明实施例提供了一种数据标签方法和装置,以实现对海量数据的提炼和整合和标签化处理。
第一方面,本发明实施例提供了一种数据标签方法,包括:
获取海量行为日志数据;
从获取的行为日志数据中提取得到各行为主体的标识以及各行为主体的属性;
依据提取得到的各行为主体的标识,将同一行为主体标识的属性进行合并,得到各行为主体的属性集合;
将各行为主体的属性集合与预设的标签规则进行匹配,并依据匹配结果为各行为主体添加标签。
第二方面,本发明实施例还提供了一种数据标签装置,包括:
数据获取模块,用于获取海量行为日志数据;
数据提取模块,用于从获取的行为日志数据中提取得到各行为主体的标识以及各行为主体的属性;
数据整合模块,用于依据提取得到的各行为主体的标识,将同一行为主体标识的属性进行合并,得到各行为主体的属性集合;
数据打标模块,用于将各行为主体的属性集合与预设的标签规则进行匹配,并依据匹配结果为各行为主体添加标签。
本发明实施例通过获取海量行为日志数据,从获取的行为日志数据中提取得到各行为主体的标识以及各行为主体的属性,并依据提取得到的各行为主体的标识,将同一行为主体标识的属性进行合并,得到各行为主体的属性集合,将各行为主体的属性集合与预设的标签规则进行匹配,并依据匹配结果为各行为主体添加标签。实现了对海量数据的提炼、整合和标签化处理,可以帮助业务人员通过数字化手段加深对数据的理解、刻画及精准识别。
附图说明
图1为本发明实施例一中的一种数据标签方法的流程图;
图2为本发明实施例一中的一种标签分类组织图;
图3为本发明实施例二中的一种数据标签方法的流程图;
图4为本发明实施例三中的数据处理的完整过程图;
图5为本发明实施例三中的流式环节的初始化过程图;
图6为本发明实施例三中的离线环节的初始化过程图;
图7为本发明实施例三中的数据提取和整合功能组成图;
图8为本发明实施例三中的数据提取过程图;
图9为本发明实施例三中的数据整合过程图;
图10为本发明实施例三中的数据提取和整合的处理流程图;
图11为本发明实施例三中的数据标签计算的功能组成图;
图12为本发明实施例三中的数据标签计算的技术实现图
图13为本发明实施例三中的数据标签计算的处理流程图;
图14为本发明实施例三中的数据入库的功能组成图;
图15为本发明实施例四中的一种数据标签装置的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一中的一种数据标签方法的流程图,本实施例可适用于对数据进行标签处理的情况,该方法可以由一种数据标签装置来执行,具体包括如下步骤:
步骤110、获取海量行为日志数据。
具体的,当前大多数网络应用或设备每天都会产生大量的行为日志数据,首先获取这些海量的行为日志数据,为后续的数据处理做准备。
步骤120、从获取的行为日志数据中提取得到各行为主体的标识以及各行为主体的属性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京锐安科技有限公司,未经北京锐安科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711033523.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于汽车的车底护板及带车底护板的汽车
- 下一篇:履带牵引装置和行走设备
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置