[发明专利]基于Python处理Excel的方法、装置及电子设备在审

专利信息
申请号: 202211581621.4 申请日: 2022-12-09
公开(公告)号: CN115730572A 公开(公告)日: 2023-03-03
发明(设计)人: 陈旭;施甘图;庭治宏;张寒雪 申请(专利权)人: 宏图智能物流股份有限公司;拉货宝网络科技有限责任公司
主分类号: G06F40/174 分类号: G06F40/174
代理公司: 成都睿道专利代理事务所(普通合伙) 51217 代理人: 贺理兴
地址: 646300 四川省泸州市纳溪*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 python 处理 excel 方法 装置 电子设备
【说明书】:

发明属于数据表应用技术领域,涉及基于Python处理Excel的方法、装置及电子设备,该方法包括:创建Excel文件存储路径,将Excel文件放入Excel文件存储路径;获取Excel文件存储路径下所有Excel文件的文件名;循环读取Excel文件;利用Python工具读取表格的内容;对表格进行关键字匹配,读取包含关键字的Excel文件;处理Excel文件;通过Python链接数仓数据库的方式,加载到数据库中。本发明替代手工将杂乱的Excel表格利用Python工具进行有序的整理,然后导入到数据库,提高Excel数据表格处理的速度和准确度。

技术领域

本发明属于数据表应用技术领域,具体而言,涉及基于Python处理Excel的方法、装置及电子设备。

背景技术

大数据行业发展迅速,为了将分散、零乱、标准不统一的数据整合到一起,让数据产生价值,ETL(即将数据经过抽取、清洗转换之后加载到数据仓库的过程)起到了关键的作用。在ETL过程中,通常是处理企业的各种业务系统数据库,通过各种各样的数据处理工具完成该过程,但是还有部分数据是来自线下的表格,或者是没有对外接口的只能手工下载的一些表格,而且这些表格还会因为各种原因,导致表格会不断地发生变化,就会给数据处理过程增加很多麻烦,无法对数据进行有序、有结构地分类组织和存储。

发明内容

为了解决传统方式中只能通过手工对杂乱Excel表格数据进行整理的问题,本发明提供基于Python处理Excel的方法、装置及电子设备。

第一方面,本发明提供了基于Python处理Excel的方法,包括:

创建Excel文件存储路径,将Excel文件放入所述Excel文件存储路径;

获取所述Excel文件存储路径下所有所述Excel文件的文件名;

循环读取所述Excel文件;

利用Python工具根据所述Excel文件存储路径与所述Excel文件的文件名,读取表格的内容;

对表格进行关键字匹配,读取包含所述关键字的所述Excel文件;

处理所述Excel文件:通过获取表格关键字的方式获取表头,对所述表头不符合设定条件的内容进行删除,设置表格内容的字段类型,筛选文件字段内容去掉表格中的行,通过填充的方式对字段缺失的表格进行补齐;

通过Python链接数仓数据库的方式,加载到数据库中。

第二方面,本发明提供了基于Python处理Excel的装置,包括创建单元、获取单元、第一读取单元、第二读取单元、匹配单元、处理单元与加载单元;

所述创建单元,用于创建Excel文件存储路径,将Excel文件放入所述Excel文件存储路径;

所述获取单元,用于获取所述Excel文件存储路径下所有所述Excel文件的文件名;

所述第一读取单元,用于循环读取所述Excel文件;

所述第二读取单元,用于利用Python工具根据所述Excel文件存储路径与所述Excel文件的文件名,读取表格的内容;

所述匹配单元,用于对表格进行关键字匹配,读取包含所述关键字的所述Excel文件;

所述处理单元,用于处理所述Excel文件:通过获取表格关键字的方式获取表头,对所述表头不符合设定条件的内容进行删除,设置表格内容的字段类型,筛选文件字段内容去掉表格中的行,通过填充的方式对字段缺失的表格进行补齐;

所述加载单元,用于通过Python链接数仓数据库的方式,加载到数据库中。

第三方面,本发明公开了一种电子设备,包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宏图智能物流股份有限公司;拉货宝网络科技有限责任公司,未经宏图智能物流股份有限公司;拉货宝网络科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211581621.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top