[发明专利]一种铁路主数据的清洗方法有效
| 申请号: | 201510498531.2 | 申请日: | 2015-08-13 |
| 公开(公告)号: | CN105183949B | 公开(公告)日: | 2019-03-19 |
| 发明(设计)人: | 李平;史天运;王英杰;马小宁;邹丹;刘彦军;刘军;王虎;杨连报;潘佩芬;卢瑞珊;刘俊 | 申请(专利权)人: | 中国铁道科学研究院;中国铁道科学研究院电子计算技术研究所;北京经纬信息技术公司 |
| 主分类号: | G06F17/50 | 分类号: | G06F17/50 |
| 代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 李相雨 |
| 地址: | 100081*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 铁路 数据 清洗 方法 系统 | ||
本发明提供了一种铁路主数据的清洗方法,该方法包括:构建铁路主数据属性模型;接收导入数据属性模型的导入数据;对导入数据的编码数据进行唯一性检验;根据预设的编码规则,对通过唯一性检验的导入数据中的编码数据,利用正值表达式方式进行数据格式验证;将通过数据格式验证的编码数据写入主数据属性模型,并将存在空缺值、错误值或冲突值的错误数据作为异常编码数据进行记录;对主数据属性模型中编码数据的变化状态进行记录,绘制编码数据的变化轨迹,以实现编码数据的管理。本发明大大提高了数据清洗的准确度,降低了数据清洗的成本,使导入的数据和已有数据保持一致,提高数据的共享性。
技术领域
本发明涉及数据管理技术领域,尤其涉及一种铁路主数据的清洗方法。
背景技术
随着高速铁路信息化发展,铁路系统中各部门业务数据的一致性管理越来越重要。
在铁路信息化建设之初,公用基础信息的理念薄弱,缺乏统筹规划,各系统建设多面向各自单独的业务应用,公用基础信息分散于各个相互隔离的系统,形成自采集、自存储、自维护的现象。对公用基础信息的概念有着不同的理解,从各系统中抽取数据进行统一的管理没有达成共识,且各系统基础信息格式各异,多词一义、一词多义等现象普遍存在,数据难以共享。
因此,如何结合目前高速铁路信息化的行业需求,提供一种铁路主数据的清洗方法及系统,以满足不同机构对数据访问的需求,保证铁路行业内各业务应用系统的基础数据的一致性具有重要意义。
发明内容
鉴于上述问题,本发明提出了一种克服上述问题或者至少部分地解决上述问题的铁路主数据的清洗方法及系统,实现铁路主数据的数据清洗,使导入的数据和已有数据保持一致,提高数据的共享性。
根据本发明的一个方面,提供了一种铁路主数据的清洗方法,该方法包括:
构建铁路主数据属性模型;
接收导入所述数据属性模型的导入数据;
对导入数据的编码数据进行唯一性检验;
根据预设的编码规则,对通过唯一性检验的导入数据中的编码数据,利用正值表达式方式进行数据格式验证;
将通过数据格式验证的编码数据写入主数据属性模型,并将存在空缺值、错误值或冲突值的错误数据作为异常编码数据进行记录;
对所述主数据属性模型中编码数据的变化状态进行记录,绘制编码数据的变化轨迹,以实现编码数据的管理。
其中,所述方法还包括:
对所述异常编码数据进行编码修改;
根据预设的编码规则,利用正值表达式方式对修正后的编码数据再次进行第二数据格式验证,并将通过第二数据格式验证的编码数据写入主数据属性模型。
其中,所述方法还包括:
定期对所述主数据属性模型中的编码数据进行数据格式的一致性校验;
根据当前的编码规则,对校验出的数据格式不一致的编码数据进行编码更新,并对该编码数据的变化状态进行记录,更新该编码数据的变化轨迹。
其中,当所述主数据属性模型中编码数据进行更新之后,所述方法还包括:
对更新后的编码数据进行审核校验;
根据预设版本管理策略,确定通过审核校验的编码数据的发布版本,并进行发布。
其中,当接收到用户写入的新的编码数据时,所述方法还包括:
对用户写入的新的编码数据进行唯一性检验;
根据所述预设的编码规则,对用户输入的新的编码数据进行数据格式的一致性校验。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国铁道科学研究院;中国铁道科学研究院电子计算技术研究所;北京经纬信息技术公司,未经中国铁道科学研究院;中国铁道科学研究院电子计算技术研究所;北京经纬信息技术公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510498531.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种变压器有载分接开关在线滤油机
- 下一篇:一种漆包线涂漆模具
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





