[发明专利]数据加工方法及系统有效
申请号: | 201410855040.4 | 申请日: | 2014-12-31 |
公开(公告)号: | CN104462604B | 公开(公告)日: | 2017-10-31 |
发明(设计)人: | 吴锦德 | 申请(专利权)人: | 成都市卓睿科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F11/07 |
代理公司: | 四川省成都市天策商标专利事务所51213 | 代理人: | 秦华云 |
地址: | 610000 四川省*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及计算机信息处理技术领域,提供一种数据加工方法及系统,以解决数据加工过程中数据整合利用困难的问题。该数据加工方法主要包括从数据源采集数据、对数据进行加工整理、对加工整理后的数据进行校验、将校验后的数据根据应用需求输出,本发明提出的技术方案将数据进行了清理,规范了数据格式,通过二次加工提高了数据的适用范围。 | ||
搜索关键词: | 数据 加工 方法 系统 | ||
【主权项】:
一种数据加工方法,其特征在于包括如下步骤:步骤A:从数据源采集数据,将采集的数据转化为统一的格式存入第一数据库;步骤B:对第一数据库中的数据进行加工整理,所述加工整理具体包括原始数据清理、数据格式化处理、数据对比、数据关联处理、数据二次加工;步骤C:对加工整理后的数据进行校验;步骤D:将校验后的数据根据应用需求输出至第二数据库,所述第二数据库为业务系统的数据库;所述数据源为数据库系统和/或互联网;从互联网采集数据的方法包括:目标网站定位;网页源码分析;网站数据建模;数据抓取;所述步骤C中的校验为数据唯一性校验、数据格式校验或数据合理性校验;所述数据唯一性校验具体包括对数据表一个字段进行单一性检索或对多个字段的组合进行单一性检索;所述数据格式校验包括对数据的类型进行检索;所述数据的合理性校验包括对日期、字符长度、类型进行判断;所述原始数据清理具体包括明显错误数据处理、重复数据处理和数据合并处理;所述数据格式化处理包括特殊字符的删除与替换;所述数据对比包括将不同数据源的数据根据数据字段进行对比,然后将同类数据整合至数据表中并根据时间节点形成数据历史表;所述数据关联处理包括将不同数据表中相关联的数据进行标引,并建立索引关系;所述数据二次加工包括针对原始数据的数据挖掘建立数据索引。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都市卓睿科技有限公司,未经成都市卓睿科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410855040.4/,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置