[发明专利]LSM-tree结构中数据文件的合并方法及装置有效
申请号: | 201611184022.3 | 申请日: | 2016-12-19 |
公开(公告)号: | CN106599247B | 公开(公告)日: | 2020-04-17 |
发明(设计)人: | 赵安安;陈宗志 | 申请(专利权)人: | 北京奇虎科技有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22 |
代理公司: | 北京市浩天知识产权代理事务所(普通合伙) 11276 | 代理人: | 宋菲;刘云贵 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | lsm tree 结构 数据文件 合并 方法 装置 | ||
本发明公开了一种LSM‑tree结构中数据文件的合并方法及装置,其中,数据文件中记录有若干个以数据键值对形式存储在LSM‑tree结构中的数据条目和元信息条目;所述方法包括:针对数据文件中的一条数据条目,在缓存中查找该数据条目对应的元信息条目;若在缓存中未查找到该数据条目对应的元信息条目,则在数据文件中查找该数据条目对应的元信息条目,并将在数据文件中查找到的该数据条目对应的元信息条目写入缓存;根据数据条目对应的元信息条目,确定数据条目是否为应该保留的数据条目,若否,则在数据文件合并过程中删除数据条目。根据本发明提供的技术方案,加快了查找元信息条目的速度,有效地提高了合并数据文件的效率,优化了数据文件合并方式。
技术领域
本发明涉及互联网技术领域,具体涉及一种LSM-tree结构中数据文件的合并方法及装置。
背景技术
LSM-tree(日志结构的合并树,Log-Structured Merge-Tree)通过批量存储技术规避了磁盘随机写入问题,大幅度地提高了写性能。具体地,可利用 LSM-tree来存储数据条目和元信息条目。在LSM-tree结构中,通过数据文件来记录数据条目和元信息条目。当需要对数据文件进行合并时,针对数据文件中的每一条数据条目,都需要在数据文件中查找该数据条目对应的元信息条目,然后根据该数据条目对应的元信息条目来确定该数据条目是否为在合并过程中应该保留的数据条目。因此,现有技术中的这种合并方式存在着效率低下的问题。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的LSM-tree结构中数据文件的合并方法及装置。
根据本发明的一个方面,提供了一种LSM-tree结构中数据文件的合并方法,数据文件中记录有若干个以数据键值对形式存储在LSM-tree结构中的数据条目和元信息条目,该方法包括:
针对数据文件中的一条数据条目,在缓存中查找该数据条目对应的元信息条目;
若在缓存中未查找到该数据条目对应的元信息条目,则在数据文件中查找该数据条目对应的元信息条目,并将在数据文件中查找到的该数据条目对应的元信息条目写入缓存;
根据数据条目对应的元信息条目,确定数据条目是否为应该保留的数据条目,若否,则在数据文件合并过程中删除数据条目。
根据本发明的另一方面,提供了一种LSM-tree结构中数据文件的合并装置,数据文件中记录有若干个以数据键值对形式存储在LSM-tree结构中的数据条目和元信息条目,该装置包括:
第一查找模块,适于针对数据文件中的一条数据条目,在缓存中查找该数据条目对应的元信息条目;
第二查找模块,适于若第一查找模块在缓存中未查找到该数据条目对应的元信息条目,则在数据文件中查找该数据条目对应的元信息条目;
写入模块,适于将第二查找模块在数据文件中查找到的该数据条目对应的元信息条目写入缓存;
确定模块,适于根据数据条目对应的元信息条目,确定数据条目是否为应该保留的数据条目;
处理模块,适于若确定模块确定得到数据条目不为应该保留的数据条目,则在数据文件合并过程中删除数据条目。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司,未经北京奇虎科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611184022.3/2.html,转载请声明来源钻瓜专利网。