[发明专利]生成描述信息的方法及装置在审
申请号: | 201610162827.1 | 申请日: | 2016-03-21 |
公开(公告)号: | CN107220251A | 公开(公告)日: | 2017-09-29 |
发明(设计)人: | 殷琳君;林沛坤;罗净;朱洪波 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京博浩百睿知识产权代理有限责任公司11134 | 代理人: | 宋子良 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 生成 描述 信息 方法 装置 | ||
技术领域
本发明涉及计算机领域,具体而言,涉及一种生成描述信息的方法及装置。
背景技术
目前,随着大数据技术的迅猛发展,如何便于业务人员快速分析数据,是大数据应用需要解决的关键问题。
业务人员经常需要基于基础数据进行各种统计分析,该过程通常需要编写SQL语句在数据库中运行。例如:对于基于多张数据表的统计分析,需要采用人工方式通过数据表的元信息来获取数据表之间的连接关系。假设第一张数据表包含有3个字段,其分别为:设备标识(ID)、日期以及设备状态;第二张数据表包含有2个字段,其分别为:设备ID和公司ID;第三张数据表包含有2个字段,其分别为:公司ID和公司名称,那么通过数据表的元信息可以获知,第一张数据表和第二张数据表可以通过“设备ID”加以连接,第二张数据表和第三张数据表可以通过“公司ID”加以连接,通过连接这三张数据表,可以分析出每个公司在预设时间段内(例如:最近1个月)发生的特定事件(例如:设备故障率)。
对于case by case的统计分析,表连接语句可以根据特定案例来编写,即业务人员需要为每个案例分别定制不同的SQL语句。然而,正是由于case by case的统计分析方式需要针对每个案例分别编写SQL语句,由此易造成此种操作方式不仅工作效率较低,而且发生错误的概率较高。
因此,相关技术中并没有提供在给定若干张数据表且可获知数据表之间的关系的情况下,如何通过采用自动生成合法的表连接SQL语句的实现方式来完成数据分析。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种生成描述信息的方法及装置,以至少解决相关技术中无法在给定若干张数据表且可获知数据表之间的关系的情况下,通过采用自动生成合法的表连接SQL语句的实现方式来完成数据分析的技术问题。
根据本发明实施例的一个方面,提供了一种生成描述信息的方法,包括:获取多张数据表中每张数据表所包含的字段信息;根据字段信息确定多张数据表相互间的关联关系;利用多张数据表相互间的关联关系生成描述信息,其中,描述信息用于记录多张数据表相互间的连接次序以及相邻数据表之间所使用的连接条件。
可选地,根据字段信息确定多张数据表相互间的关联关系包括:选取步骤:从多张数据表中选取任意一张待遍历的数据表;查找步骤:查找与选取的数据表所包含的字段信息中具有一个或多个相同字段的数据表,并将查找到的数据表设置为选取的数据表的待连接数据表;在选取的数据表与待连接数据表之间建立关联关系;返回选取步骤,直至多张数据表被全部遍历。
可选地,利用多张数据表相互间的关联关系生成描述信息包括:按照多张数据表相互间的关联关系从初始遍历的数据表开始依次获取下一个遍历的数据表的标识信息,与下一个遍历的数据表相邻接的数据表的标识信息以及下一个遍历的数据表与邻接的数据表之间的连接条件,其中,邻接的数据表为已经遍历过的数据表;采用获取到的下一个遍历的数据表的标识信息,邻接的数据表的标识信息以及下一个遍历的数据表与邻接的数据表之间的连接条件生成描述信息。
可选地,采用获取到的下一个遍历的数据表的标识信息,邻接的数据表的标识信息以及下一个遍历的数据表与邻接的数据表之间的连接条件生成描述信息包括:先根据下一个遍历的数据表的标识信息和邻接的数据表的标识信息建立下一个遍历的数据表与邻接的数据表之间的关联关系后,再记录下一个遍历的数据表与邻接的数据表之间的连接条件,分别生成与已经遍历的数据表对应的分段连接信息;联合全部分段连接信息,生成描述信息。
可选地,如果下一个遍历的数据表同时与多个数据表相邻接和/或下一个遍历的数据表与部分相邻接的数据表存在多个相同的字段时,则记录的下一个遍历的数据表与邻接的数据表之间的连接条件是由下一个遍历的数据表与多个数据表相邻接所产生的连接条件和/或由下一个遍历的数据表与部分相邻接的数据表存在多个相同的字段所产生的连接条件的并集。
根据本发明实施例的另一方面,还提供了一种生成描述信息的装置,包括:获取模块,用于获取多张数据表中每张数据表所包含的字段信息;确定模块,用于根据字段信息确定多张数据表相互间的关联关系;生成模块,用于利用多张数据表相互间的关联关系生成描述信息,其中,描述信息用于记录多张数据表相互间的连接次序以及相邻数据表之间所使用的连接条件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610162827.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种模板配置方法及系统
- 下一篇:常减压装置常压塔常一线闪点预测方法
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置