[发明专利]数据库系统中对象的编码及运算方法与数据库服务器有效
申请号: | 201710121672.1 | 申请日: | 2017-03-02 |
公开(公告)号: | CN108536705B | 公开(公告)日: | 2021-10-01 |
发明(设计)人: | 刘辉军;孟聪;张朝威 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F16/242 | 分类号: | G06F16/242;G06F16/2453;G06F16/2455 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 万晓君 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据库 系统 对象 编码 运算 方法 服务器 | ||
本发明公开了一种数据库系统中对象的编码和运算方法、数据库管理系统以及数据库服务器。根据数据库中多个对象样本空间的相关性,形成全局对象样本空间,在全局对象样本空间内创建全局字典表,以为每一个对象提供全局唯一的编码值作为其对象标识,并保证对象标识与对象的描述信息为一一映射关系。基于全局字典表对数据库对象进行编码压缩,减少编码开销。进一步地,直接使用对象标识进行数据库查询运算,将字符串类型的运算优化为整数类型的运算,提升了运算的效率。
技术领域
本发明涉及数据库技术领域,并且更具体地,涉及一种数据库系统中对象的编码及运算方法、数据库管理系统与数据库服务器。
背景技术
现代化信息处理是建立在基于对象标识(ID)的认识模型上的,在该认知模型中,任一样本空间中对象(Object)都有一个标识(ID),以区别于样本空间中的其他对象,然后使用人类语言来描述此对象。这样,所有对象都具有的两个基本属性:对象ID和对象描述信息,即任一对象可以被表示为:Object=(ID,description)。基于该认知模型的信息处理主要包括:1)建立对象样本空间。2)通过人工/自动编码方式为对象样本空间中的每个对象提供编码值标识该对象的唯一ID,并保存该对象的人类语言描述信息。3)根据信息处理逻辑,使用{Object=(ID,description)}信息参与各种信息运算。
数据库在处理数据时,也正是基于上述认知模型的。以商用数据库为例,它通常使用字典表对各种字符串/文本进行编码/解码,然后参与各种查询运算。具体地,若数据库对源数据文件某一列采用字典表,则这一列的数据就构成了一个对象样本空间。导入数据时,数据库会选择相应的编码算法,对该列中每一个对象进行编码,生成唯一标识ID并保存到数据表的物理文件中。源数据文件中,该列提供的其他数据即对应于该列对象的描述信息。此外,该表拥有一个私有的字典表,存储了该列对象的映射信息,用于解码。比如对源数据文件中“支行名称”列进行编码得到的编码值(对象ID)如下:
对象ID 支行名称(描述) 0001 XX银行(A支行) 0002 XX银行(B支行) 0003 XX银行(C支行) … …
最后,参与各种查询运算时,数据库首先加载该列的编码值,然后反向查询其私有的字典表,以获取该列每个对象的描述信息,然后根据这些描述信息进行后续的查询运算。
由上可见,数据库表的各个列在编码过程中使用了私有字典表,增加了编码消耗,浪费了磁盘存储空间。另外,由于各个列使用自身的私有字典表,存在联系的多表之间无法共享编码信息,得到的编码值(对象ID)不能够跨表通用。当需要参与查询运算时,首先必须通过私有字典表得到所有对象的描述信息,然后才能够对这些描述信息进行各种复杂的运算,大大降低了数据库执行查询运算的性能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710121672.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种轨迹查询方法、系统及装置
- 下一篇:榜单生成方法、装置及系统