[发明专利]一种基于业务端的数据清洗方法有效

专利信息
申请号: 201910863837.1 申请日: 2019-09-12
公开(公告)号: CN110555019B 公开(公告)日: 2023-03-24
发明(设计)人: 周道华;杨陈;曾俊;洪江;彭容;黄维;李武鸿;刘瑞东;张明娟;许江泽;吴婷婷;付志华;刘杰;詹飞;程武彬;杨眉 申请(专利权)人: 成都中科大旗软件股份有限公司
主分类号: G06F16/215 分类号: G06F16/215
代理公司: 成都华风专利事务所(普通合伙) 51223 代理人: 张巨箭
地址: 610000 四川省成都市中国(四川)自由贸易试*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 业务 数据 清洗 方法
【权利要求书】:

1.一种基于业务端的数据清洗方法,其特征在于:包括:

业务端将本地数据转换为对应的标签字段,并形成标签字段组;

将标签字段组上传至服务端;

服务端存储有若干标准标签字段与对应数据清洗算法的关联关系;

服务端将上传得到的标签字段组与所述标准标签字段进行匹配,得到匹配度最高的标准标签字段;

服务端将与匹配度最高的标准标签字段关联的数据清洗算法下发至业务端;

业务端利用得到的数据清洗算法对本地数据进行清洗。

2.根据权利要求1所述的一种基于业务端的数据清洗方法,其特征在于:所述业务端将标签字段组上传至服务端时,将业务端类型一并上传至服务器;

所述服务端存储有若干标准标签字段与对应数据清洗算法的关联关系,替换为:

所述服务端存储有若干业务端类型、标准标签字段与对应数据清洗算法的关联关系。

3.根据权利要求1所述的一种基于业务端的数据清洗方法,其特征在于:所述的标准标签字段与对应数据清洗算法的关联关系的获取方式,具体包括:

获取若干业务端数据,所述业务端数据包括标签字段;

根据实际需求,选择多个标签字段组成数据字典,以形成标准标签字段;

对标准标签字段的数据采用若干数据清洗算法进行清洗;

将清洗效果最好的数据清洗算法与对应的标准标签字段进行关联。

4.根据权利要求1所述的一种基于业务端的数据清洗方法,其特征在于:所述方法还包括:

服务端将清洗后的源数据进行调取。

5.根据权利要求4所述的一种基于业务端的数据清洗方法,其特征在于:所述方法还包括:

服务端检测到业务端接入预定的接口时,建立与业务端的连接,并创建服务线程,以获取并解析来自业务端的请求;所述请求包括数据清洗算法获取请求和源数据调取请求;

所述服务端的服务线程在解析到来自业务端的请求为数据清洗算法获取请求时,利用所述预定的接口进行数据下发;

所述服务端的服务线程在解析到来自业务端的请求为源数据调取请求时,建立业务端与源数据接口的连接。

6.根据权利要求5所述的一种基于业务端的数据清洗方法,其特征在于:在所述建立业务端与源数据接口的连接后,创建第一监听线程;同时:

所述第一监听线程对源数据调取过程进行监听,判断源数据接口是否能访问成功并成功返回请求数据,同时判断源数据接口接收到的返回的数据是否为有效数据;如果有任意一项不满足,则生成预警信息并发送;

在判断源数据接口能访问成功后,创建对应于所述源数据接口的第二监听线程;

所述第二监听线程轮询式监听业务端的数据库日志记录,验证当前数据是否有效存在;如果不满足,则生成预警信息并发送。

7.根据权利要求6所述的一种基于业务端的数据清洗方法,其特征在于:所述的判断源数据接口是否能访问成功,具体包括:

通过http协议访问请求源数据接口,验证接口是否正常能调用;

判断成功返回请求数据,具体包括:

采用http协议判断接口请求状态,并根据返回的协议状态码进行验证;

所述的判断源数据接口接收到的返回的数据是否为有效数据,具体包括:

验证数据结构:接口请求成功后返回的数据结构是否满足业务需求;

验证每个数据项格式是否正确,包括字符、数字、汉字和长度在内的字符类型验证;

验证所有返回的数据项是否都是合法有效数据;

所述验证当前数据是否有效存在,具体包括:

在业务端的数据库中以轮询式搜索日志记录的数据表中是否有新数据产生,具体采用任务调度器轮询式使用Tsql脚本语句搜索。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都中科大旗软件股份有限公司,未经成都中科大旗软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910863837.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top