[发明专利]一种通用的离线数据接入方法及系统有效

专利信息
申请号: 201710521896.1 申请日: 2017-06-30
公开(公告)号: CN107317865B 公开(公告)日: 2019-11-05
发明(设计)人: 张云;木伟民;李名扬;刘帆;王伟平 申请(专利权)人: 中国科学院信息工程研究所
主分类号: H04L29/08 分类号: H04L29/08
代理公司: 北京君尚知识产权代理有限公司 11200 代理人: 刘召民
地址: 100093 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 通用 离线 数据 接入 方法 系统
【说明书】:

发明公开了一种通用的离线数据接入方法及系统,基于离线数据接入通用处理模板,来适配多种业务数据接入。具有如下优点:1)数据接入与业务耦合度低,数据接入系统更为通用,音视频数据、图片数据、博客数据、即时通信数据等数据源,都可以采用该方法及系统;2)多节点分布式采集数据,在保证数据正确传输的前提下,提供传输的并行度和传输效率,并实现了负载均衡;3)提供完善的异常处理和报错机制;4)实时监控系统运行状态,系统更为稳定。

技术领域

本申请属于数据通信技术领域,涉及一种通用的离线数据接入方法及系统。

背景技术

目前的离线数据接入系统大都与特定的业务相关,根据业务的不同定制设计不同的接入接口,每个系统只针对特定的业务,无法将定制的系统应用到其他的数据处理业务。现有的开发出来的不同的数据接入系统,其数据提供方和数据接入系统没有可遵循的统一规范,这导致数据接入系统的使用具有局限性,通用性差。此外,现有系统大多采用单节点数据采集,传输效率低;异常处理和报错机制不完善,系统出错后难以在较短的时间内恢复。

发明内容

本发明的目的在于提供一种通用的离线数据接入方法及系统,基于离线数据接入通用处理模板,来适配多种业务数据接入。

为了实现上述目的,本发明采用以下技术方案:

一种通用的离线数据接入方法,包括以下步骤:

1)构建离线数据接入通用处理模板;

2)数据提供方根据步骤1)构建的离线数据接入通用处理模板提供规范化数据;

3)数据接收方根据步骤1)构建的离线数据接入通用处理模板从数据提供方多节点分布式采集数据并进行解析及存储。

进一步地,步骤1)中,所述离线数据接入通用处理模板的构建包括构建用于存储数据提供方提交的结构化和非结构化的数据文件的/ToPlatForm/Data目录和用于存储数据提供方提交的控制文件的/ToPlatForm/Ctrl目录。

进一步地,步骤2)中,所述数据提供方提供规范化数据的步骤包括:

2-1)将结构化数据采用Json格式封装成Json数据文件,然后在/ToPlatForm/Data目录中上传Json数据文件和非结构化数据,并在/ToPlatForm/Ctrl目录中上传Json数据文件和非结构化数据对应的控制文件;

2-2)数据提供方在数据文件和控制文件上传完成后,在/ToPlatForm/Ctrl目录中生成控制文件对应的.ok文件,以标识本次提交的所有文件均已正确上传。

进一步地,步骤3)中,所述数据接收方从数据提供方多节点分布式采集数据的步骤包括:

3-1)数据接收方读取/ToPlatForm/Ctrl目录下带有.ok文件的控制文件,采用FTP传输协议多节点分布式采集对应的/ToPlatForm/Data目录中的数据文件;

3-2)数据接收方完成数据文件采集后,在/ToPlatForm/Ctrl目录下生成控制文件对应的.dwd文件,以标识数据接收方已经采集完对应的数据文件。

进一步地,所述离线数据接入通用处理模板的构建还包括构建用于存储数据接收方下发的报错文件的/FromPlatForm/Feedback/Error目录。

进一步地,所述数据接收方在采集文件过程中出错时,在/FromPlatForm/Feedback/Error目录下生成以”Err_”开头接对应的控制文件文件名命名的报错文件,报错文件中指明出错文件的文件名和出错类型;数据接收方生成报错文件后,生成该报错文件的.ok文件,以标识此次报错完成;所述数据提供方定时读取FromPlatForm/Feedback/Error目录,根据报错信息做相应的处理。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710521896.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top