[发明专利]一种数据抽取方法及装置在审
申请号: | 201910318311.5 | 申请日: | 2019-04-19 |
公开(公告)号: | CN110032559A | 公开(公告)日: | 2019-07-19 |
发明(设计)人: | 颜怀柏;刘雄兵;赖文文;李晓刚 | 申请(专利权)人: | 成都四方伟业软件股份有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/2453 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 徐丽 |
地址: | 610000 四川省*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请实施例提供一种数据抽取方法及装置,所述方法包括:获取待抽取数据库的数据库语言,根据数据库语言对待抽取数据库进行分区操作,并对应将计算机设备的处理线程分为同等数量的目标线程。通过目标线程对各个分区进行数据抽取操作,得到分区数据,然后将抽取出来的分区数据发送到目标查询引擎中进行数据处理,将处理后的数据进行数据清洗,得到目标数据。采用本申请提供的数据抽取方法,能够实现对数据的快速抽取,提高了工作效率。 | ||
搜索关键词: | 数据抽取 抽取 数据库语言 分区数据 目标线 数据库 计算机设备 处理线程 分区操作 工作效率 目标查询 目标数据 数据清洗 数据处理 申请 引擎 分区 | ||
【主权项】:
1.一种数据抽取方法,其特征在于,应用于计算机设备,所述方法包括:获取待抽取数据库的数据库语言;根据所述数据库语言,将所述待抽取数据库划分为多个分区;根据所述多个分区的数量,将所述计算机设备的处理线程分为对应数量的目标线程;采用所述对应数量的目标线程对所述多个分区分别进行数据抽取,得到分区数据;将所述分区数据发送至目标查询引擎进行数据处理;将处理后的所述分区数据进行数据清洗,得到目标数据。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都四方伟业软件股份有限公司,未经成都四方伟业软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910318311.5/,转载请声明来源钻瓜专利网。