[发明专利]一种基于业务端的数据清洗方法有效
申请号: | 201910863837.1 | 申请日: | 2019-09-12 |
公开(公告)号: | CN110555019B | 公开(公告)日: | 2023-03-24 |
发明(设计)人: | 周道华;杨陈;曾俊;洪江;彭容;黄维;李武鸿;刘瑞东;张明娟;许江泽;吴婷婷;付志华;刘杰;詹飞;程武彬;杨眉 | 申请(专利权)人: | 成都中科大旗软件股份有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215 |
代理公司: | 成都华风专利事务所(普通合伙) 51223 | 代理人: | 张巨箭 |
地址: | 610000 四川省成都市中国(四川)自由贸易试*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 业务 数据 清洗 方法 | ||
1.一种基于业务端的数据清洗方法,其特征在于:包括:
业务端将本地数据转换为对应的标签字段,并形成标签字段组;
将标签字段组上传至服务端;
服务端存储有若干标准标签字段与对应数据清洗算法的关联关系;
服务端将上传得到的标签字段组与所述标准标签字段进行匹配,得到匹配度最高的标准标签字段;
服务端将与匹配度最高的标准标签字段关联的数据清洗算法下发至业务端;
业务端利用得到的数据清洗算法对本地数据进行清洗。
2.根据权利要求1所述的一种基于业务端的数据清洗方法,其特征在于:所述业务端将标签字段组上传至服务端时,将业务端类型一并上传至服务器;
所述服务端存储有若干标准标签字段与对应数据清洗算法的关联关系,替换为:
所述服务端存储有若干业务端类型、标准标签字段与对应数据清洗算法的关联关系。
3.根据权利要求1所述的一种基于业务端的数据清洗方法,其特征在于:所述的标准标签字段与对应数据清洗算法的关联关系的获取方式,具体包括:
获取若干业务端数据,所述业务端数据包括标签字段;
根据实际需求,选择多个标签字段组成数据字典,以形成标准标签字段;
对标准标签字段的数据采用若干数据清洗算法进行清洗;
将清洗效果最好的数据清洗算法与对应的标准标签字段进行关联。
4.根据权利要求1所述的一种基于业务端的数据清洗方法,其特征在于:所述方法还包括:
服务端将清洗后的源数据进行调取。
5.根据权利要求4所述的一种基于业务端的数据清洗方法,其特征在于:所述方法还包括:
服务端检测到业务端接入预定的接口时,建立与业务端的连接,并创建服务线程,以获取并解析来自业务端的请求;所述请求包括数据清洗算法获取请求和源数据调取请求;
所述服务端的服务线程在解析到来自业务端的请求为数据清洗算法获取请求时,利用所述预定的接口进行数据下发;
所述服务端的服务线程在解析到来自业务端的请求为源数据调取请求时,建立业务端与源数据接口的连接。
6.根据权利要求5所述的一种基于业务端的数据清洗方法,其特征在于:在所述建立业务端与源数据接口的连接后,创建第一监听线程;同时:
所述第一监听线程对源数据调取过程进行监听,判断源数据接口是否能访问成功并成功返回请求数据,同时判断源数据接口接收到的返回的数据是否为有效数据;如果有任意一项不满足,则生成预警信息并发送;
在判断源数据接口能访问成功后,创建对应于所述源数据接口的第二监听线程;
所述第二监听线程轮询式监听业务端的数据库日志记录,验证当前数据是否有效存在;如果不满足,则生成预警信息并发送。
7.根据权利要求6所述的一种基于业务端的数据清洗方法,其特征在于:所述的判断源数据接口是否能访问成功,具体包括:
通过http协议访问请求源数据接口,验证接口是否正常能调用;
判断成功返回请求数据,具体包括:
采用http协议判断接口请求状态,并根据返回的协议状态码进行验证;
所述的判断源数据接口接收到的返回的数据是否为有效数据,具体包括:
验证数据结构:接口请求成功后返回的数据结构是否满足业务需求;
验证每个数据项格式是否正确,包括字符、数字、汉字和长度在内的字符类型验证;
验证所有返回的数据项是否都是合法有效数据;
所述验证当前数据是否有效存在,具体包括:
在业务端的数据库中以轮询式搜索日志记录的数据表中是否有新数据产生,具体采用任务调度器轮询式使用Tsql脚本语句搜索。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都中科大旗软件股份有限公司,未经成都中科大旗软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910863837.1/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置