[发明专利]用于LSM数据结构中有效记录查找的高速缓存在审

专利信息
申请号: 201980010105.6 申请日: 2019-01-29
公开(公告)号: CN111656341A 公开(公告)日: 2020-09-11
发明(设计)人: T·方哈内尔;J·B·马丁;N·怀亚特;D·昂加罗;T·钟 申请(专利权)人: 易享信息技术有限公司
主分类号: G06F16/22 分类号: G06F16/22;G06F16/172;G06F16/84
代理公司: 北京市磐华律师事务所 11336 代理人: 高伟
地址: 美国加利*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要: 公开了与维护可用于定位存储在数据结构中的数据的高速缓存有关的技术。在各种实施例中,计算机系统维护具有存储数据库的文件的多个级别的数据结构。这些文件可包括一个或更多个记录,每个记录都有一个键和对应的数据。该计算机系统还可以维护用于数据库的高速缓存,该数据库的条目为键存储数据结构的文件中相应记录的位置的指示。在一些实施例中,计算机系统接收访问存储在数据结构中的特定记录的请求,其中该请求指定可用于定位特定记录的键。计算机系统可以经由键从高速缓存中检索特定记录的位置的特定指示,并且可以使用该特定指示来访问特定记录。
搜索关键词: 用于 lsm 数据结构 有效 记录 查找 高速缓存
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于易享信息技术有限公司,未经易享信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201980010105.6/,转载请声明来源钻瓜专利网。

同类专利
  • 对RDBMS中存储的聚合存储数据全面支持多值、多字段、多级别、多位置功能索引的技术-202180095433.8
  • H·张;刘振华;吕颖;B·C·哈默施密特;D·J·麦玛宏;D·B·穆克尹 - 甲骨文国际公司
  • 2021-12-17 - 2023-10-27 - G06F16/22
  • 本文是针对基于多级别、多字段、多值索引和查询的关系数据库中JavaScript对象表示法(JSON)文档的加速。在实施例中,计算机将许多分层数据对象存储到关系数据库中的表中,这些分层数据对象分别包含多个级别,该多个级别分别包含一个或多个字段。为多个级别中的至少两个级别中的字段中的索引值生成索引。基于该索引,执行引用关系数据库中的表和至少一个索引字段的数据库语句。本文中的索引提供了对分层数据对象的更多级别中的更多字段的匹配,从而减少或消除了在索引访问之后通过强力的进一步过滤。在索引访问之后,匹配数组字段内的序数位置不需要进一步过滤。单个索引增加了索引条目的空间局部性以实现加速。最大限度地减少索引维护以实现加速。
  • 数据库区域地图的自动线性聚类推荐-202180092687.4
  • S·布达拉科提 - 甲骨文国际公司
  • 2021-12-30 - 2023-09-29 - G06F16/22
  • 公开了自动且高效地创建用于数据库查询处理的区域地图的技术。这些技术包括创建样本数据集来表示原始数据集、构建查询工作负载建模器来表征查询的完整工作负载、构建聚类质量评估器来评估在列上具有特定聚类的数据集上的查询性能、通过评估工作负载对与不同聚类对应的样本数据集的不同应用来找到聚类解,并确定聚类解的哪些列可以从区域地图中受益。
  • 用于管理表数据的数据控制器和方法-202180089822.X
  • 谢尔盖·罗曼诺维奇·巴希罗夫;瓦莱里·谢尔盖耶维奇·马特文科;张学仓 - 华为技术有限公司
  • 2021-01-11 - 2023-09-22 - G06F16/22
  • 本发明涉及一种用于管理第一表的数据的数据控制器,所述数据包括索引向量集。所述数据控制器用于:将第二表存储在数据存储器中,其中所述第二表的数据包括索引向量第一子集,所述索引向量第一子集包括所述索引向量集的至少两个连续索引向量。对于索引向量第二子集的索引向量的索引,所述数据控制器还用于根据存储在所述数据存储器中的所述第二表的所述索引向量第一子集来计算所述索引向量。所述索引向量第一子集和所述索引向量第二子集构成所述索引向量集。本发明还涉及一种用于管理第一表的数据的方法,所述数据包括索引向量集。
  • 用于大元数据管理的列技术-202180090563.2
  • 帕文·埃达拉;莫莎·帕苏曼斯基 - 谷歌有限责任公司
  • 2021-11-09 - 2023-09-19 - G06F16/22
  • 一种使用列技术来管理大元数据的方法(700)包括接收从数据表(158)请求与查询参数(21)相匹配的数据块(152)的查询请求(20)。数据表与系统表(154)相关联,每个系统表包括对应数据块的元数据。该方法包括基于查询请求生成系统查询(172)以返回与匹配查询参数的数据块相对应的行的子集(210)。该方法还包括基于查询请求和系统查询生成最终查询(186),以从数据表中返回对应于行的子集的数据块的子集。该方法还包括确定数据块的子集中的任何数据块是否与查询参数匹配,并且当一个或多个数据块与查询参数匹配时,返回匹配的数据块。
  • 知识图谱构建方法和装置-202080104019.4
  • 叶现一 - 西门子(中国)有限公司
  • 2020-09-10 - 2023-05-09 - G06F16/22
  • 知识图谱构建方法和装置,该知识图谱构建方法包括:获取与用户数据涉及相同领域的训练数据;利用训练数据训练用于预测被输入属性值所属实体属性的分类模型;利用分类模型确定用户数据中每一列数据中各属性值所属的实体属性,并根据每一列数据中各属性值所属的实体属性确定该列数据所描述的实体属性;确定各列数据之间的映射关系;根据各列数据之间的映射关系及所描述的实体属性,确定各列数据所描述实体属性之间的映射关系;根据实体属性之间的映射关系及各实体属性所对应的实体,确定各实体之间的映射关系;生成包括有各实体之间映射关系的知识图谱。该方案使开发人员可以根据知识图谱快速确定用户数据所描述实体之间的关联关系。
  • 聚类表的无混洗重新聚类-202180027769.0
  • 章画;帕万·埃达拉;仁·阮 - 谷歌有限责任公司
  • 2021-04-12 - 2023-04-04 - G06F16/22
  • 一种用于聚类表(159)的无混洗重新聚类的方法(400),包括接收由聚类键值(154)排序的第一和第二组(158)聚类数据块(152)。第二组中的一个或多个数据块的聚类键值的范围与第一组中的数据块的聚类键值的范围重叠。该方法还包括生成用于将第一和第二组聚类数据块划分为第三组的分割点(310)。第三组中的每个数据块包括不与第三组中的任何其他数据块重叠的聚类键值的范围。每个分割点定义第三组中的数据块的聚类键值的范围的上限或下限。
  • 具有子字典树数据结构的字典树数据结构-202180046205.1
  • P·J·赫尔兰德 - 易享信息技术有限公司
  • 2021-06-18 - 2023-03-28 - G06F16/22
  • 本申请公开了涉及能够存储指示数据库键码的信息的树形数据结构的技术。计算机系统可以操作数据库。计算机系统可以存储能够用于针对数据库执行键码查找的多层级树形数据结构。在各种情况下,多层级树形数据结构可以在系统存储器中存储为多个子树形数据结构,每个子树形数据结构包括链接节点集合。多个子树形数据结构中给定的一个可以在系统存储器中存储为信息的相应连续块。计算机系统可以访问涵盖多层级树形数据结构中的特定层级范围的第一特定子树形数据结构的相应连续块。访问可以在没有访问涵盖特定层级范围内一个或多个层级的一个或多个其他子树形数据结构的情况下执行。
  • 云数据库的弹性列式缓存-202180049302.6
  • 安扬·库马尔·阿米里西特蒂;程讯;维拉尔·萨阿 - 谷歌有限责任公司
  • 2021-05-04 - 2023-03-14 - G06F16/22
  • 一种方法,包括接收缓存配置信息(22),缓存配置信息(22)指示与用户(12)相关联的缓存(160)的最大尺寸(24)和递增尺寸(26)。缓存被配置为以行为主的格式存储表(158)的一部分。该方法包括以列为主的格式将表的多个列(310)的子集缓存在缓存中,并且接收多个数据请求,数据请求请求访问表,并且与要求访问一个或多个列的对应访问模式(180)相关联。在执行一个或多个工作负载的同时,该方法包括:对于表的每一列,确定指示在预定时间段访问对应列的次数的访问频率(182),并基于访问模式、最大尺寸和递增尺寸来动态地调整列的子集。
  • 实体解析系统中匹配字段的自动检测-202180048991.9
  • N·R·辛格;A·赛斯;S·S·纳加纳;S·帕卡拉·斯里尼瓦斯 - 国际商业机器公司
  • 2021-07-13 - 2023-03-14 - G06F16/22
  • 提供了执行以下操作的方法、计算机程序产品和/或系统:获得有效负载属性字段;从有效负载属性字段确定潜在匹配字段;确定针对潜在匹配字段中的每一个的匹配函数;基于匹配函数来确定潜在匹配字段中的每个潜在匹配字段的属性得分;获得参考数据集合的得分列表;确定潜在匹配字段中的每一个的属性得分与参考数据集合得分列表的相关性;至少部分基于相关性从潜在匹配字段选择新匹配字段;确定所选择的新匹配字段中的每个新匹配字段的最佳权重;基于针对假肯定和假否定的阈值比率,从所选择的新匹配字段中选择用于匹配的属性字段;以及提供用于匹配的属性字段和针对属性字段的关联的最佳权重。
  • 对数据容器使用前缀删除操作-202180031613.X
  • J·M·雅各布;D·博尔斯;G·S·拉姆达西 - 美光科技公司
  • 2021-04-07 - 2022-12-09 - G06F16/22
  • 将包括键和与所述键相关联的值的键值对存储在数据容器的当前片段中。所述键包括标识所述当前片段的片段标识符。所述数据容器包括驻留在非易失性存储器装置上的多个片段。响应于确定所述当前片段的大小超过阈值,将新片段添加到所述容器。删除具有参考所述数据容器的一或多个创建最久的片段的相应当前片段标识符的所述多个键值对。
  • 用于使用分布式账本跟踪数据沿袭和记录生命周期的系统和方法-202180012992.8
  • A·G·林奇;Z·卡尔马;A·蒂瓦里 - 摩根大通国家银行
  • 2021-01-08 - 2022-10-11 - G06F16/22
  • 公开了用于使用分布式账本跟踪数据沿袭和记录生命周期的系统和方法。在一个实施例中,用于跟踪记录生命周期事件的方法可以包括:(1)通过记录生命周期工具为记录生命周期中的记录生命周期事件创建可记录制造物,该可记录制造物包括用于记录生命周期事件的数据;(2)通过记录生命周期工具生成数据的散列;(3)通过记录生命周期工具为可记录制造物创建记录生命周期事件元数据;(4)通过记录生命周期工具对记录生命周期事件元数据进行签名;(5)将记录生命周期事件元数据在存储位置处写入供应链元数据存储装置,其中供应链元数据存储装置可以是加密可验证且不可变的;以及(6)将散列和用于供应链元数据存储装置中的存储位置的标识符写入当前状态数据库。
  • 用于快速数据检索的通用数据索引-202080080624.2
  • 斯蒂芬·塔尔博特;柯林·泽玛 - 谷歌有限责任公司
  • 2020-11-19 - 2022-07-08 - G06F16/22
  • 一种通用数据索引构建方法,包括通过所述数据库管理系统(250)建立与所述数据库(100,240)的通信耦合。该方法还包括在所述宿主计算机(230)的存储器中的所述索引(170,270)中创建数据库的所有列中的所述字段值(120A,120B,120N)与数据库的列的所有所述元数据(130A,130B,130N)的并集(150A,150B)。在这点上,索引将每个值和每个元数据与数据库中的特定位置相关联。该方法还包括向索引中添加成对字段值(160A,160B,160N)作为共现列表(180)。最后,该方法包括向索引发出查询,而不向数据库管理系统发出SQL WHERE语句,以便产生筛选的查询结果(100C)。
  • 能够选择性使用键部分的键值存储树-201980083131.1
  • A·汤姆林森 - 美光科技公司
  • 2019-12-11 - 2022-06-17 - G06F16/22
  • 本公开的各方面提供例如当在键值存储(KVS)树数据结构内存储键值对(与键相关联)或浏览所述KVS树数据结构时相对于所述KVS树数据结构选择性地使用所述键的一部分的各种实施例,所述部分例如是所述键的前缀(也被称作键的键前缀)。对于一些实施例,当基于键浏览KVS树时,KVS树的第一组层级(例如,第一系列层级)通过所述键的第一部分(例如,前缀)浏览,且KVS树的第二组层级(例如,第二系列层级)通过所述键的第二部分(例如,整个部分)浏览。
  • 电子表单表转换-201980099111.3
  • 董浩宇;韩石;张冬梅;J·M·哈尔贝斯塔姆;吕潇 - 微软技术许可有限责任公司
  • 2019-08-08 - 2022-03-18 - G06F16/22
  • 提供了一种用于电子表单表转换的方案。在该方案中,检测电子表单表的至少一个表头区域和数据区域。通过分析表头区域中的单元合并和/或缩进、和/或数据区域的对应单元中的数据项之间的函数关系,确定表头区域中每个表头区域的层级结构。基于对表头区域的层级结构的识别,电子表单表能够被转换为关系表。以此方式,基于表头层级来辅助理解表头结构,可以实现从电子表单表向关系表的自动转换。
  • 管理对数字资产的访问-202080032673.9
  • T·萨克森;B·斯帕尔 - 索尼集团公司;索尼音乐娱乐公司
  • 2020-05-08 - 2021-12-10 - G06F16/22
  • 在与移动设备通信的服务器系统处管理对数字内容的访问,包括:从移动设备接收用户账户标识符和表现信息;访问存储可收集记录的可收集数据库;将接收的表现信息与可收集记录中的表现信息进行比较;访问存储用户账户记录的用户账户数据库;将所检索的可收集标识符添加到所识别的用户账户记录中;从所识别的可收集记录中检索音乐相关资产标识符;和向所述移动设备发送确认,所述确认指示可收集资产已经被收集,并且指示检索到的音乐相关资产标识符。
  • 链接和编写工作表-202080023027.6
  • 詹姆斯·L·盖尔;肯尼思·特龙;马克斯·H·塞登;詹森·D·弗朗茨 - 西格玛计算机有限公司
  • 2020-03-19 - 2021-11-05 - G06F16/22
  • 链接和编写工作表包括:接收创建从数据源工作表链接的引用工作表的请求,其中所述数据源工作表是来自数据库的数据集的呈现;使用对所述请求中的所述数据源工作表元数据的引用来检索数据源工作表元数据;以及使用所述数据源工作表元数据创建所述引用工作表,所述引用工作表呈现由所述数据源工作表呈现的所述数据集的至少一个子集,其中创建所述引用工作表包括:使用在所述请求中接收到的所述数据源工作表元数据和引用工作表元数据生成数据库查询;以及向所述数据库发出所述数据库查询。
  • 数据库索引确定和验证-201980088776.4
  • S·达斯;V·R·纳拉萨雅;许高翔;S·乔杜里;A·乔瓦诺维克;M·拉杜罗威克 - 微软技术许可有限责任公司
  • 2019-12-23 - 2021-11-02 - G06F16/22
  • 用于重组数据库的数据的物理布局的系统、方法和计算机可执行指令。工作负载从先前执行的数据库操作中被选择。先前执行的数据库操作和工作负载的总资源消耗被确定。工作负载的总资源消耗大于先前执行的数据库操作的总资源消耗的预定阈值。用于数据库的优化操作是使用工作负载而被确定的。数据库的克隆数据库被创建。对克隆数据库执行优化操作。针对数据库的数据库操作被接收。对数据库和克隆数据库执行数据库操作。基于对数据库和克隆数据库的数据库操作的执行,与数据库的性能相比,验证克隆数据库的性能被改进。
  • 用于处理大宽数据的过程控制工具-201980091998.1
  • T·希尔;D·卡茨;P·斯莫林斯基;S·拉马林加姆;S·希利安 - 泰必高软件公司
  • 2019-12-13 - 2021-10-19 - G06F16/22
  • 一种用于处理来自自动化制造操作的宽数据的过程控制工具。该工具包括特征选择器、分析服务器和可视化引擎。特征选择器从至少一个制造过程应用中接收过程输入数据,其中过程输入数据包括多个观察值和相关联的变量,将所接收的过程输入数据转换成在每个观察值中针对每个变量具有一行的堆叠格式,将所标识的类别变量转换成数字变量,并且将所标识的时间序列数据转换成固定数量的区间,计算对预测因子值与结果变量之间的关系的强度进行测量的统计数据,对预测因子值进行排序、过滤、以及旋转。分析服务器执行至少一个操作,以标识过滤后的预测因子值中的预测因子值之间的交互,例如使用最大似然计算或预定义搜索。可视化引擎显示交互以用于管理制造操作。
  • 用于管理交通工具数据的系统和方法-201980088405.6
  • 埃万盖洛斯·斯莫迪斯 - 埃万盖洛斯·斯莫迪斯
  • 2019-11-06 - 2021-08-17 - G06F16/22
  • 本公开提供了用于管理自动驾驶交通工具数据的方法和系统。该方法可以包括:(a)从自动驾驶交通工具收集所述自动驾驶交通工具数据,其中自动驾驶交通工具数据具有至少为1太字节的大小;(b)处理所述自动驾驶交通工具数据以生成与所述自动驾驶交通工具数据相对应的元数据,其中所述自动驾驶交通工具数据被存储在数据库中;(c)使用元数据的至少一部分从数据库中检索自动驾驶交通工具数据的子集,该自动驾驶交通工具数据的子集具有小于自动驾驶交通工具数据的大小;并且(d)存储或传输自动驾驶交通工具数据的子集。
  • 使用多个GPU对散列表有效且可扩展地构建和探测-201980083821.7
  • T·卡尔德魏;J·J·克劳斯;N·萨哈尼赫 - 辉达公司
  • 2019-10-17 - 2021-08-06 - G06F16/22
  • 所描述的方法提供了使用多个GPU来有效地且可扩展地构建和探测散列表并物化探测的结果。由GPU进行的用于构建和/或探测散列表的随机存储器访问可以分布在GPU上并且使用全局位置标识符并发地执行。全局位置标识符可从条目的数据计算并使用该条目来标识用于插入和/或探测的全局位置。全局位置标识符可由GPU使用以确定是否使用条目执行插入或探测和/或在哪里执行插入或探测。为了在物化探测散列表的结果时协调GPU,可以在GPU中的每个GPU可访问的存储器中维护到全局输出缓冲区的全局偏移,或者GPU可以使用本地输出缓冲区大小的排他和来计算全局偏移。
  • 全面支持自主JSON文档对象(AJD)云服务的技术-201980084880.6
  • 刘振华;V·阿罗拉;吕颖;S·克里希纳穆尔蒂;H·J·张;B·C·哈默施密特;J·J·施皮格尔 - 甲骨文国际公司
  • 2019-12-18 - 2021-08-06 - G06F16/22
  • 本发明涉及数据库中文档的数据网格的自主调谐。本文是用于存储单元格自主维护本地索引以及其它优化元数据和算法以加速对文档的分布式集合的选择性访问的技术。在实施例中,每个存储单元格持久化文档的相应子集。每个存储单元格在存储器中存储将每个项目映射到相应文档子集的一个或多个文档中该项目出现的(一个或多个)位置的(一个或多个)相应索引。一个或多个计算机至少基于存储单元格的索引的子集来执行来自数据库管理系统的数据访问请求。在实施例中,JSON文档服务的云提供易于使用的、完全自主的JSON文档数据库,该数据库可以水平和弹性地伸缩以交付文档事务和查询的快速执行,而无需数据库管理员进行调谐。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top