[发明专利]数据加工方法及系统有效

专利信息
申请号: 201410855040.4 申请日: 2014-12-31
公开(公告)号: CN104462604B 公开(公告)日: 2017-10-31
发明(设计)人: 吴锦德 申请(专利权)人: 成都市卓睿科技有限公司
主分类号: G06F17/30 分类号: G06F17/30;G06F11/07
代理公司: 四川省成都市天策商标专利事务所51213 代理人: 秦华云
地址: 610000 四川省*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及计算机信息处理技术领域,提供一种数据加工方法及系统,以解决数据加工过程中数据整合利用困难的问题。该数据加工方法主要包括从数据源采集数据、对数据进行加工整理、对加工整理后的数据进行校验、将校验后的数据根据应用需求输出,本发明提出的技术方案将数据进行了清理,规范了数据格式,通过二次加工提高了数据的适用范围。
搜索关键词: 数据 加工 方法 系统
【主权项】:
一种数据加工方法,其特征在于包括如下步骤:步骤A:从数据源采集数据,将采集的数据转化为统一的格式存入第一数据库;步骤B:对第一数据库中的数据进行加工整理,所述加工整理具体包括原始数据清理、数据格式化处理、数据对比、数据关联处理、数据二次加工;步骤C:对加工整理后的数据进行校验;步骤D:将校验后的数据根据应用需求输出至第二数据库,所述第二数据库为业务系统的数据库;所述数据源为数据库系统和/或互联网;从互联网采集数据的方法包括:目标网站定位;网页源码分析;网站数据建模;数据抓取;所述步骤C中的校验为数据唯一性校验、数据格式校验或数据合理性校验;所述数据唯一性校验具体包括对数据表一个字段进行单一性检索或对多个字段的组合进行单一性检索;所述数据格式校验包括对数据的类型进行检索;所述数据的合理性校验包括对日期、字符长度、类型进行判断;所述原始数据清理具体包括明显错误数据处理、重复数据处理和数据合并处理;所述数据格式化处理包括特殊字符的删除与替换;所述数据对比包括将不同数据源的数据根据数据字段进行对比,然后将同类数据整合至数据表中并根据时间节点形成数据历史表;所述数据关联处理包括将不同数据表中相关联的数据进行标引,并建立索引关系;所述数据二次加工包括针对原始数据的数据挖掘建立数据索引。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都市卓睿科技有限公司,未经成都市卓睿科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201410855040.4/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top