[发明专利]一种业务对象的数据抽取方法及装置有效
申请号: | 201610009604.1 | 申请日: | 2016-01-07 |
公开(公告)号: | CN106951427B | 公开(公告)日: | 2020-08-18 |
发明(设计)人: | 方波;周家英;郑高超 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/25 | 分类号: | G06F16/25 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 黄熊 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 业务 对象 数据 抽取 方法 装置 | ||
本申请公开一种业务对象的数据抽取方法及装置,该方法包括:接收变量表达式,所述变量表达式是针对业务对象中需要进行抽取的属性名称的表达;根据变量表达式建立变量表达式树,所述变量表达式树中的每个节点对应所述需要进行抽取的属性名称;当接收到所述业务对象的源数据后,调用预先设定的针对所述变量表达式树中不同节点的数据抽取方式,抽取所述需要进行抽取的属性名称对应的属性值。上述方法及装置用于提供一种可以按需抽取数据的方法。
技术领域
本申请涉及计算机技术领域,尤其涉及一种业务对象的数据抽取方法及装置。
背景技术
随着大数据时代的到来,数据分析,数据挖掘等课题得到了越来越多的关注,但无论哪个课题,都需要先从业务对象中进行数据抽取,有了抽取到的数据才能够进行分析、挖掘等。数据抽取就是从业务对象源数据中抽取属性名称对应的属性值的过程,比如,想要分析某个业务对象(用户)的兴趣,就需要抽取该用户中包含的个人资料、历史行为等数据。
现有技术,实现对业务对象源数据进行抽取的方法可以先对源数据进行json(JavaScript Object Notation)格式化,再获取格式化后的数据。json是一种轻量级的数据交换格式,并且采用了类似于C语言(包括C、C++、C#、Java、JavaScript、Perl、Python等)家族的一些习惯,所以易于程序解析和生成。比如,应用程序A内有业务对象源数据,如果应用程序B需要这些源数据,就可以先用json化工具对业务对象源数据进行json格式化,再获取格式化后的数据,从而达到抽取的目的。
然而,现有技术在抽取过程中会将一个业务对象中包含的源数据全部进行json格式化,也就是说现有技术会抽取到全部的数据。如果仅需要抽取源数据中的部分数据,是无法做到的。
发明内容
本申请实施例提供一种业务对象的数据抽取方法,用于提供一种可以按需抽取数据的方法。
本申请实施例提供一种业务对象的数据抽取装置,用于提供一种可以按需抽取数据的方法。
本申请实施例采用下述技术方案:
一种业务对象的数据抽取方法,包括:
接收变量表达式,所述变量表达式是针对业务对象中需要进行抽取的属性名称的表达;
根据变量表达式建立变量表达式树,所述变量表达式树中的每个节点对应所述需要进行抽取的属性名称;
当接收到所述业务对象的源数据后,调用预先设定的针对所述变量表达式树中不同节点的数据抽取方式,抽取所述需要进行抽取的属性名称对应的属性值。
优选地,调用预先设定的针对所述变量表达式树中不同节点的数据抽取方式,抽取所述需要进行抽取的属性名称对应的属性值,包括:当需要抽取的属性名称对应的节点在所述变量表达式树中为叶子节点时,抽取所述叶子节点对应的属性名称的属性值。
优选地,调用预先设定的针对所述变量表达式树中不同节点的数据抽取方式,抽取所述需要进行抽取的属性名称对应的属性值,包括:当需要抽取的属性名称对应的节点在所述变量表达式树中为包含数据集合的叶子节点,建立叶子节点数据表;抽取所述叶子节点对应的属性名称的所有属性值;将所述所有属性值中的每一个存入所述叶子节点数据表中。
优选地,调用预先设定的针对所述变量表达式树中不同节点的数据抽取方式,抽取所述需要进行抽取的属性名称对应的属性值,包括:当需要抽取的属性名称对应的节点在所述变量表达式树中为中间节点时,查找所述中间节点下的子节点;调用预先设定的针对所述变量表达式树中不同节点的数据抽取方式,抽取所述子节点对应的属性名称的属性值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610009604.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于切粒机冷冻水与三效蒸发蒸汽热交换装置
- 下一篇:高效湿法制粒机
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置