[发明专利]一种野外科学观测数据表头表尾自动检测入库的方法有效

专利信息
申请号: 202110559497.0 申请日: 2021-05-21
公开(公告)号: CN113239105B 公开(公告)日: 2022-05-31
发明(设计)人: 魏守峰;包亮;余慧明 申请(专利权)人: 武汉一格空间科技有限公司
主分类号: G06F16/25 分类号: G06F16/25;G06F40/205
代理公司: 北京汇众通达知识产权代理事务所(普通合伙) 11622 代理人: 李丹
地址: 432000 湖北省武汉市东湖新技术开发区光谷大道77号金融港后台服务中心基*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 野外 科学 观测 数据 表头 自动检测 入库 方法
【说明书】:

发明公开了一种野外科学观测数据表头表尾自动检测入库的方法,它涉及软件技术领域。其步骤为:野外科学观测数据表头表尾分隔符在线快速自动检测;海量野外科学观测数据记录实体在线快速整合与入库;野外科学观测数据治理与多模式可视化。本发明实现自动检测观测数据表头表尾、自动提取数据记录实体及海量观测数据快速整合入库,具有自动检测表头表尾、支持海量表格快速入库的优势,满足野外科学观测数据表头表尾自动检测、数据实体自动提取与快速入库、多样化展示等需求,应用前景广阔。

技术领域

本发明涉及的是软件技术领域,具体涉及一种野外科学观测数据表头表尾自动检测入库的方法。

背景技术

科学数据作为科技创新、经济发展和相关决策活动不可或缺的科技资源,被公认为继物质和能量之后的第三类资源,是国家重要的战略资源。在大数据时代,对海量科学数据的全面掌握和深入挖掘分析正是当前许多前沿科学领域研究取得重大发现和突破的关键依托基础。随着我国野外科学观测事业的快速发展,野外科学观测数据有力支撑了我国地球系统科学、气象水文、环境保护和生态文明等建设。

野外科学观测数据的海量持续增长,对野外科学观测数据的接收、提取、保存、分析和应用提出了更高的要求。野外科学观测数据具有持续时间长、类型多样、海量快速增长等特点。其原始获取的数据主要存储形式是Excel格式、csv格式和txt格式等文本型表格数据。其中,Excel是非常流行的表格数据计算机处理工具,操作简单,支持通过函数进行处理,是一种应用广泛、能够很好提升工作效率的表格数据处理工具。

然而,随着互联网的发展,传统的以Excel为代表的个人计算机表格型数据处理工具难以完全满足人们对野外科学观测数据日益增长的多样化、在线化之处理需求,诸如野外科学观测数据处理时遇到的表头表尾如何自动检测、海量数据如何规范整合与快速整合入库等难点一直困扰着人们。

现有野外科学观测数据的原始数据结构如图1所示,其合并入库处理流程如图2,常见的野外科学观测数据表头表尾提取技术方面,需要人为事先分析判断数据构成特点、表头表尾所在位置、分隔符等信息,再针对每类表格数据开发特定的数据读取程序,甚至是手工处理表头表尾等内容。在野外科学观测数据入库方面,需要人为分析判断字段名称、字段类型,海量数据入库处理效率很低。具体地,现有的野外科学观测数据表头表尾、记录实体提取与海量数据入库展示技术主要存在以下问题:

(1)表头表尾所在位置及分隔符难以在线自动检测。在进行多个野外科学观测数据文件合并、关联处理及关联查询等操作时,首先需要判断多个数据文件各自的表头、表尾、记录行与分隔符等信息。目前通常由作业人员人工判断各个表格数据的表头、表尾、记录行与分隔符等信息,再通过人工或编程方式提取记录内容并进行后续之合并、关联处理及关联查询等操作。这种基于人工分析的编程或手工提取表头表尾的方法,存在手工处理易出错、编写的程序适用性差、遇到新的数据结构需要重新编程、处理费时费力等问题。

(2)海量野外科学观测数据难以在线快速整合入库。随着数字时代的到来,如今人们需要处理的野外科学观测数据的数据量呈几何级数增长,有的长时间序列观测数据可达到上千万甚至上亿条记录。Excel由于基于文件的设计思路,无法达到数据库系统的性能,在处理大量数据时常常会遇到严重的问题。比如,Excel表格一旦读取超过上百万条的记录时就会非常缓慢,此时若要进行函数操作则会使电脑罢工,更无法开展更深层次的数据分析操作。

为了解决野外科学观测数据提取处理应用中的诸多痛点难点,且目前业内还没有一种针对野外科学观测数据表头表尾自动检测的方法和平台,开发一种野外科学观测数据表头表尾自动检测入库的方法尤为必要。

发明内容

针对现有技术上存在的不足,本发明目的是在于提供一种野外科学观测数据表头表尾自动检测入库的方法,实现自动检测观测数据表头表尾、自动提取数据记录实体及海量观测数据快速整合入库,具有自动检测表头表尾、支持海量表格快速入库的优势,满足野外科学观测数据表头表尾自动检测、数据实体自动提取与快速入库、多样化展示等需求,易于推广使用。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉一格空间科技有限公司,未经武汉一格空间科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110559497.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top