[发明专利]一种分布式文档形数据存取方法及装置在审
申请号: | 201310492602.9 | 申请日: | 2013-10-18 |
公开(公告)号: | CN104572711A | 公开(公告)日: | 2015-04-29 |
发明(设计)人: | 贾瑞;王志平 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海波拓知识产权代理有限公司 31264 | 代理人: | 韩绍君 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 分布式 文档 形数 存取 方法 装置 | ||
技术领域
本发明涉及数据库技术,尤其涉及一种分布式文档形数据存取方法及装置。
背景技术
关系型数据库的典型实现主要被用于执行规模小而读写频繁,或者大批量极少写访问的事务,其在一些数据敏感的应用中表现了糟糕的性能,例如为巨量文档建立索引、高流量网站的网页服务,以及发送流式媒体等服务中。
为了解决现有关系型数据库的上述缺陷,现有技术中开发出NoSQL技术。NoSQL是对不同于传统的关系型数据库的数据库管理系统的统称。两者存在许多显著的不同点,其中最重要的是NoSQL不使用SQL作为查询语言。其数据存储可以不需要固定的表格模式,也经常会避免使用SQL的JOIN操作,一般有水平可扩展性的特征。
MongoDB是一种可扩展,高性能,开源的面向文档的数据库管理系统。MongoDB主要解决的是海量数据的访问效率问题,根据官方文档:数据量达到50GB以上的时候,访问速度是mysql的10倍以上。业界很多不是很复杂的web应用就是使用MongoDB。
使用MongoDB对大企业海量级数据应用是把双刃剑:使用成本低,可以快速搭建服务开始使用;但是由于对开源系统源码级别的不够深入(读懂这些代码也是一个很耗时有挑战的事情),后续的系统维护和个性化的需求极其难以满足,在出现问题时也难以得到开源项目团队的及时有力的支持。基于上述考虑,对于企业来说,其关键性业务使用开源的MongoDB带来的风险不可控也是不可以接受的。但是,如果自行开发自己的数据管理系统,人力,资源,时间花费都是巨大的。因此,需要一种一种分布式文档形数据存取方法能够及时满足大企业海量数据不断的需求。
发明内容
有鉴于此,有必要提供一种分布式文档形数据存取方法及装置,其具有更高的存取效率。
一种分布式文档形数据存取方法,包括:在云存储平台中存储多条键-值类形数据记录;将所述多条键-值类形数据记录的键分别存储在多个有序集合中;为所述多个有序集合内的键建立索引;根据所述索引获取指定范围的键;以及根据获取的键存取对应的值。
一种分布式文档形数据存取装置,包括:存储模块,用于在云存储平台中存储多条键-值类形数据记录;键处理模块,用于将所述多条键-值类形数据记录的键分别存储在多个有序集合中;索引模块,用于为所述多个有序集合内的键建立索引;获取模块,用于根据所述索引获取指定范围的键;以及存取模块,用于根据获取的键存取对应的值。
根据上述的分布式文档形数据存取方法及装置,通过将云存储平台中存储的多条记录的键排序,并拆分成一定的范围后打包至单个文件内,从而可以一次性获取指定范围内的键,进一步地,据此可以实现指定范围内的顺序存取。相比于逐一按照键进行存取具有更高的存取效率。
为让本发明的上述和其他目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附图式,作详细说明如下。
附图说明
图1是一种云存储平台的示意图。
图2是一种云存储服务器的结构框图。
图3是第一实施例提供的分布式文档形数据存取方法流程图。
图4为图3所示的方法的示意图。
图5为第二实施例提供的分布式文档形数据存取方法示意图。
图6是第三实施例提供的分布式文档形数据存取方法流程图。
图7是图6的方法其中一个步骤的详细流程图。
图8为第四实施例提供的分布式文档形数据存取装置的结构框图。
图9为第五实施例提供的分布式文档形数据存取装置的结构框图。
图10为第六实施例提供的分布式文档形数据存取装置的结构框图。
具体实施方式
为更进一步阐述本发明为实现预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明的具体实施方式、结构、特征及其功效,详细说明如后。
本发明实施例涉及一种分布式文档形数据存取方法及装置。其用于在现有的云存储平台的基础上快速实现分布式文档形数据管理系统,从而可以高效的方式进行分布式文档形数据的存取。
图1为现有的云存储平台的示意图。如图1所示,现有的云存储平台本质上是一个无序的键-值(Key-Value)类型的分布式文件存储系统,其中键是唯一可用来获取对应的值的入口,而值可以是各种格式的文档。由于采用分布式物理存储,因此,具体的数据是被分散存储在多个物理存储节点中。云存储平台自身会维护索引用于记录及查询某条记录对应的物理存储信息,从而实现记录的存取。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310492602.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:网页点击情况的展示方法及装置
- 下一篇:网页资源的管理方法及装置