[发明专利]一种异构数据实时交互优化处理方法在审
申请号: | 201810271215.5 | 申请日: | 2018-03-29 |
公开(公告)号: | CN108509585A | 公开(公告)日: | 2018-09-07 |
发明(设计)人: | 张可;柴毅;朱燕;黄若山;朱博 | 申请(专利权)人: | 重庆大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京众合诚成知识产权代理有限公司 11246 | 代理人: | 胡柯 |
地址: | 400044 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 异构数据 实时交互 优化处理 索引表 数据查询效率 数据汇总模块 分布式存储 存储空间 存储位置 检索方式 排序策略 数据查询 数据格式 数据交互 索引查询 高效性 快速性 用户端 分层 构建 返回 转换 | ||
一种异构数据实时交互优化处理方法,采用建立异构数据索引表的方法,实现异构数据实时交互。将异构数据进行拆分进行分布式存储,并提取关键词依靠关键词计数排序策略,构建异构数据索引表,通过分层检索方式,寻找所需数据的存储位置,最后通过数据汇总模块得到所需数据,转换为所需数据格式返回给用户端,从而实现数据交互。该方法具有快速性、高效性,对异构数据的拆分节省了存储空间并加快了数据查询的速度;利用索引查询大大提高了数据查询效率。
技术领域
本发明涉及数据处理技术领域,具体涉及一种异构数据实时交互处理方法。
背景技术
在企业信息化建设进程中,大量的功能性应用被集成于企业信息门户系统,需要对其进行集中统一管理,以满足共享数据应用的需求。但是,大量的功能性应用之间存在多类差异,体现在开发语言、开发平台、操作系统、数据库管理系统、网络通信协议等方面。其中,数据库差异相对突出,不同的系统数据源和应用需求导致了数据结构上的差异性,由于异构数据库在数据访问和数据共享的方式不同,无法很好的实现数据之间的实时共享,因此,如何实现异构数据的实时交互处理是目前的技术难题。
发明内容
本发明的目的就是提供一种异构数据实时交互优化处理方法,它可以解决异构数据的实时交互处理问题,实现数据之间的实时共享。
本发明的目的是通过这样的技术方案实现的,具体步骤如下:
1)拆分异构数据,采用分布式存储方式存储数据,形成新的数据集;
2)根据分布式存储数据的存储地址,建立异构索引表;
3)接收用户端发送的查询请求,将检索目标内容进行关键词提取;
4)根据异构索引表逐级查询关键词所在的位置;
5)将查询后的信息分发至数据库配置信息中对应的数据存储数据库,从对应的数据存储数据库中提取所需数据;
6)将步骤5)中提取的所需数据汇总并返回给用户端。
进一步,步骤1)中所述拆分异构数据的具体步骤如下:
1-1)按结构形式将不同结构的数据分别存储到不同的互相独立的数据集中;
1-2)采用水平分区的方式对各数据集进行拆分。
进一步,步骤2)中所述建立异构索引表的具体步骤如下:
2-1)对新的数据集提取关键词,并进行预处理得到关键词在该数据集中的查询计数;
2-2)将关键词按查询计数从小到大排序,并形成计数表;
2-3)以计数表为基础,逐级构建索引形成索引表,每级索引表包含对应的关键词及其对应的数据对象信息;
2-4)建立索引表与源数据库的映射关系,根据索引信息可获得数据所在位置信息。
进一步,步骤4)中所述根据异构索引表逐级查询关键词所在的位置的具体步骤如下:
4-1)将用户端的查询请求与索引的关键词库进行映射,将原查询映射到目标查询;
4-2)对查询中的关键词按照计数表中计数大小排序;
4-3)按计数大小从小到大依次读取查询中的关键词,在索引表中自上向下逐级查询,找到匹配的关键词。
进一步,步骤6)中所述提取的所需数据汇总并返回给用户端的具体方法为:
根据数据映射关系从对应的数据集中提取所需数据并汇总,将提取的数据转换为所需的数据格式,返回给用户端。
由于采用了上述技术方案,本发明具有如下的优点:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810271215.5/2.html,转载请声明来源钻瓜专利网。