[发明专利]表格数据的检索系统构建方法及计算机存储介质在审

专利信息
申请号: 202310377201.2 申请日: 2023-04-10
公开(公告)号: CN116561118A 公开(公告)日: 2023-08-08
发明(设计)人: 请求不公布姓名 申请(专利权)人: 上海携宁计算机科技股份有限公司
主分类号: G06F16/22 分类号: G06F16/22;G06F16/242;G06F16/28;G06F40/18
代理公司: 上海申新律师事务所 31272 代理人: 吴轶淳
地址: 200030 上*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 表格 数据 检索系统 构建 方法 计算机 存储 介质
【说明书】:

本发明涉及数据处理技术领域,具体涉及一种表格数据的检索系统构建方法及存储介质,包括:步骤S1:于待检索表格中确定至少一个表格域;步骤S2:于每个表格域中确定数值子域、第一指标信息和时间信息;步骤S3:根据指标信息和时间信息生成对应于数值子域中的每个数值单元格的索引,基于索引生成对应于待检索表格的检索系统。有益效果在于:通过预先对待检索表格进行表格域的识别、划分,再对每个表格域分别进行数值子域的划分和指标、时间的提取,从而建立得到对应于每个表格域的索引,并基于索引建立检索系统。由于在子域划分、索引构建的过程中已预先进行了表格域的识别,因此能够实现对各表格域中的单元格的准确识别,实现了更好的检索效果。

技术领域

本发明涉及数据处理技术领域,具体涉及一种表格数据的检索系统构建方法。

背景技术

Excel,是Microsoft为使用Windows和Apple Macintosh操作系统的电脑编写的一款电子表格软件,其被广泛运用于行政、物流、金融等领域中,用于对相关的数据进行存储、统计、处理。为满足用户对某项数据的获取需要,各类企业往往会针对该表格编制相应的查询工具,通过图形化界面、命令行等方式实现对特定行、列的数据的查找过程。

现有技术中,已存在有较多的适用于表格文件的查找方法。比如,中国专利CN202011361683.5公开了一种多源数据颗粒化融合及指标分类分层处理方法,其是针对输入的二维数据表格进行解析,从而得到多个描述信息,包括单元格的数值项、坐标值、指标分类描述等,并依照该类描述实现对特定数据项的查找、渲染并显示。

但是,在实际实施过程中,发明人发现,上述方案在实施时,由于是直接对输入的二维数据表格确定其存在数据的表格矩阵,在完整的表格矩阵中进行数值、指标的识别、区域划分,并提取相应的第一指标信息,使得其对复杂表格类型的识别效果不佳。比如,如图1所示,该附图中示出了一种具有多个数据块的电子表格,该表格中分布有多个数据块,每个数据块分别用于显示不同的、相对独立数据,比如不同的组别、不同的数据维度等。针对该类表格数据,现有技术则难以对其进行识别,需要人工对相关的数据块进行指定。比如,中国专利CN202111473996.4公开了一种基于配置的Excel数据解析入库方法,该方案中,针对该类数据需要由人工进行数据块、日期和维度的指定,才能够进行解析得到数据。

发明内容

针对现有技术中存在的上述问题,现提供一种表格数据的检索系统构建方法,另一方面,还提供存储有对应于该检索系统构建方法的计算机指令的存储介质。

具体技术方案如下:

一种表格数据的检索系统构建方法,包括:

步骤S1:于待检索表格中确定至少一个表格域;

步骤S2:于每个所述表格域中分别确定所述表格域的数值子域和用于描述所述数值子域中的数值单元格的第一指标信息和时间信息;

步骤S3:根据所述第一指标信息和所述时间信息生成对应于所述数值子域中的每个所述数值单元格的索引,基于所述索引生成对应于所述待检索表格的检索系统。

另一方面,所述步骤S1包括:

步骤S11:于所述检索列表中遍历每一个单元格并判断当前的所述单元格是否为非空单元格;

若是,转向步骤S12;

若否,转向步骤S13;

步骤S12:根据当前的所述非空单元格生成新的临时联通区域;

步骤S13:判断是否遍历了所有的所述单元格;

若是,将所有的所述临时联通区域作为所述表格域输出;

若否,返回所述步骤S11以选取下一个所述单元格。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海携宁计算机科技股份有限公司,未经上海携宁计算机科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202310377201.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top