[发明专利]一种数据处理方法在审
申请号: | 201710418048.8 | 申请日: | 2017-06-06 |
公开(公告)号: | CN107301210A | 公开(公告)日: | 2017-10-27 |
发明(设计)人: | 郝波;柯炯亮 | 申请(专利权)人: | 福建中经汇通有限责任公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 361000 福建省厦*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种数据处理方法,通过本发明的技术方案,可知本发明该方法利用关键字段字符的区位码对数据集进行排序及分组,提高了算法的运行效率和检测精度,并且通过选出分组中具有代表性的字段,删除无关字段,减少了相似重复记录检测时的字段匹配次数,进而减少了记录匹配的运行时间,能够有效地解决大数据量的相似重复记录检测问题,并且具有清理数据源的垃圾数据的效果。 | ||
搜索关键词: | 一种 数据处理 方法 | ||
【主权项】:
一种数据处理方法,其特征在于,包括如下步骤:步骤1,对所要清洗的数据源进行数据分析,定义出数据清洗规则,并选择预设的清洗算法;步骤2,根据规则库中定义好的或用户自定义的清洗规则对数据进行预处理,将数据转换成统一的预设的数据格式;步骤3,根据预设的数据清理算法对数据中的相似重复记录、异常数据和不完整数据进行检测;步骤4,根据清理算法和规则库中定义的清理规则对所述相似重复记录、异常数据和不完整数据进行数据清理;步骤5,将清理后的数据反馈至用户端,获取用户端的反馈信息,根据所述反馈信息确定是否重新进行数据清洗步骤。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福建中经汇通有限责任公司,未经福建中经汇通有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710418048.8/,转载请声明来源钻瓜专利网。
- 上一篇:一种自动命名文件夹的方法、存储设备及移动终端
- 下一篇:一种在线数据处理方法