[发明专利]用于LSM数据结构中有效记录查找的高速缓存在审
申请号: | 201980010105.6 | 申请日: | 2019-01-29 |
公开(公告)号: | CN111656341A | 公开(公告)日: | 2020-09-11 |
发明(设计)人: | T·方哈内尔;J·B·马丁;N·怀亚特;D·昂加罗;T·钟 | 申请(专利权)人: | 易享信息技术有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/172;G06F16/84 |
代理公司: | 北京市磐华律师事务所 11336 | 代理人: | 高伟 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 lsm 数据结构 有效 记录 查找 高速缓存 | ||
公开了与维护可用于定位存储在数据结构中的数据的高速缓存有关的技术。在各种实施例中,计算机系统维护具有存储数据库的文件的多个级别的数据结构。这些文件可包括一个或更多个记录,每个记录都有一个键和对应的数据。该计算机系统还可以维护用于数据库的高速缓存,该数据库的条目为键存储数据结构的文件中相应记录的位置的指示。在一些实施例中,计算机系统接收访问存储在数据结构中的特定记录的请求,其中该请求指定可用于定位特定记录的键。计算机系统可以经由键从高速缓存中检索特定记录的位置的特定指示,并且可以使用该特定指示来访问特定记录。
技术领域
本公开总体上涉及数据库系统,并且更具体地,涉及数据库系统内的高速缓存。
当企业希望为其用户存储信息时,企业通常采用数据库管理系统,该数据库管理系统以可以被有效访问的有组织的方式存储信息。这样的数据库管理系统通常实现一种组织方案,其中信息被索引并作为具有行和列的表存储在数据库中。而且,数据库管理系统可以通过运行数据库应用程序的多个服务器来实现。这样的应用程序可以基于键/索引值通过搜索表来处理对信息的请求。随着数据量的增长,访问该数据所必需的时间也随之增长。
图1是示出根据一些实施例的实现数据库和数据库服务器的数据库系统的示例性元素的框图。
图2是示出根据一些实施例的执行各种功能的例程的示例性元素的框图。
图3是示出根据一些实施例的日志结构的合并树的示例性元素的框图。
图4A-B是示出根据一些实施例的合并过程的示例性元素的框图。
图5是示出根据一些实施例的高速缓存的示例性元素的框图。
图6A-C是示出根据一些实施例的一组清单的示例性元素的框图。
图7是示出根据一些实施例的基于基于值的高速缓存不变性的高速缓存无效方案的示例性元素的框图。
图8是示出根据一些实施例的基于基于位置的高速缓存不变性的高速缓存无效方案的示例性元素的框图。
图9-11是示出根据一些实施例的与维护高速缓存有关的示例性方法的流程图。
图12是示出根据一些实施例的示例性计算机系统的框图。
本公开包括对“一个实施例”或“实施例”的引用。短语“在一个实施例中”或“在实施例中”的出现不一定指相同的实施例。可以以与本公开一致的任何适当方式来组合特定特征、结构或特性。
在本公开内,可以将不同实体(其可以被不同地称为“单元”、“电路”、其他组件等)描述或称为“配置”为执行一个或更多个任务或操作。在本文中使用这种公式——([实体]被配置为[执行一个或更多个任务])——来指代结构(即,诸如电子电路之类的物理事物)。更具体地,该公式用于指示该结构被布置为在操作期间执行一个或更多个任务。可以说某个结构被“配置为”执行某些任务,即使该结构当前未被操作。因此,被描述或陈述为“配置为”执行某项任务的实体是指某种物理事物,诸如设备、电路、存储可执行以实现该任务的程序指令的存储器等。此短语在本文中不用于指代无形的事物。因此,“配置为”构造在本文中不用来指代软件实体,诸如应用程序编程接口(API)。
术语“配置为”并不旨在表示“可配置为”。例如,未编程的FPGA不会被认为是“配置为”执行某些具体功能,尽管它可以“可配置为”执行该功能,可以“配置为”执行编程后的功能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于易享信息技术有限公司,未经易享信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980010105.6/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 对RDBMS中存储的聚合存储数据全面支持多值、多字段、多级别、多位置功能索引的技术-202180095433.8
- H·张;刘振华;吕颖;B·C·哈默施密特;D·J·麦玛宏;D·B·穆克尹 - 甲骨文国际公司
- 2021-12-17 - 2023-10-27 - G06F16/22
- 本文是针对基于多级别、多字段、多值索引和查询的关系数据库中JavaScript对象表示法(JSON)文档的加速。在实施例中,计算机将许多分层数据对象存储到关系数据库中的表中,这些分层数据对象分别包含多个级别,该多个级别分别包含一个或多个字段。为多个级别中的至少两个级别中的字段中的索引值生成索引。基于该索引,执行引用关系数据库中的表和至少一个索引字段的数据库语句。本文中的索引提供了对分层数据对象的更多级别中的更多字段的匹配,从而减少或消除了在索引访问之后通过强力的进一步过滤。在索引访问之后,匹配数组字段内的序数位置不需要进一步过滤。单个索引增加了索引条目的空间局部性以实现加速。最大限度地减少索引维护以实现加速。
- 数据库区域地图的自动线性聚类推荐-202180092687.4
- S·布达拉科提 - 甲骨文国际公司
- 2021-12-30 - 2023-09-29 - G06F16/22
- 公开了自动且高效地创建用于数据库查询处理的区域地图的技术。这些技术包括创建样本数据集来表示原始数据集、构建查询工作负载建模器来表征查询的完整工作负载、构建聚类质量评估器来评估在列上具有特定聚类的数据集上的查询性能、通过评估工作负载对与不同聚类对应的样本数据集的不同应用来找到聚类解,并确定聚类解的哪些列可以从区域地图中受益。
- 用于管理表数据的数据控制器和方法-202180089822.X
- 谢尔盖·罗曼诺维奇·巴希罗夫;瓦莱里·谢尔盖耶维奇·马特文科;张学仓 - 华为技术有限公司
- 2021-01-11 - 2023-09-22 - G06F16/22
- 本发明涉及一种用于管理第一表的数据的数据控制器,所述数据包括索引向量集。所述数据控制器用于:将第二表存储在数据存储器中,其中所述第二表的数据包括索引向量第一子集,所述索引向量第一子集包括所述索引向量集的至少两个连续索引向量。对于索引向量第二子集的索引向量的索引,所述数据控制器还用于根据存储在所述数据存储器中的所述第二表的所述索引向量第一子集来计算所述索引向量。所述索引向量第一子集和所述索引向量第二子集构成所述索引向量集。本发明还涉及一种用于管理第一表的数据的方法,所述数据包括索引向量集。
- 在数据处理系统中使用数据实体和继承管理数据的技术-202280012434.6
- H·I·格里法森;罗伯特·帕克斯;杜桑·拉迪沃杰维克;A·H·韦斯 - 起元技术有限责任公司
- 2022-01-28 - 2023-09-22 - G06F16/22
- 在本文描述了用于由数据处理系统存储数据实体的技术。该数据处理系统可以存储使用多个数据实体生成的多个数据实体实例。该多个数据实体实例可以包括使用第一数据实体生成的第一数据实体实例和使用第二数据实体生成的第二数据实体实例。该第一数据实体实例可以包括被配置为从该第二数据实体实例的第二属性继承其值的第一属性。该数据处理系统可以提供该第二数据实体实例的第二属性的所继承值作为该第一数据实体实例的第一属性的值。
- 用于大元数据管理的列技术-202180090563.2
- 帕文·埃达拉;莫莎·帕苏曼斯基 - 谷歌有限责任公司
- 2021-11-09 - 2023-09-19 - G06F16/22
- 一种使用列技术来管理大元数据的方法(700)包括接收从数据表(158)请求与查询参数(21)相匹配的数据块(152)的查询请求(20)。数据表与系统表(154)相关联,每个系统表包括对应数据块的元数据。该方法包括基于查询请求生成系统查询(172)以返回与匹配查询参数的数据块相对应的行的子集(210)。该方法还包括基于查询请求和系统查询生成最终查询(186),以从数据表中返回对应于行的子集的数据块的子集。该方法还包括确定数据块的子集中的任何数据块是否与查询参数匹配,并且当一个或多个数据块与查询参数匹配时,返回匹配的数据块。
- 基于隐含的数据特性的动态性能调优-202080105124.X
- J·M·波斯纳;S·K·库尼塞蒂;M·卡马斯;N·卡万提斯;S·巴特卡尔;S·特罗申;S·萨克尔;S·S·戈文达拉贾普拉姆;V·克里希纳穆尔蒂 - 甲骨文国际公司
- 2020-09-04 - 2023-08-15 - G06F16/22
- 公开了用于基于数据特性改进系统性能的技术。系统可以以第一频率接收对第一数据集的更新。系统基于第一频率从多个存储配置中选择用于存储第一数据集的第一存储配置,并根据第一存储配置来存储第一数据集。系统还可以以第二频率接收对第二数据集的更新。系统基于第二频率从多个存储配置中选择用于存储第二数据集的第二存储配置,并根据第二存储配置来存储第二数据集。第二存储配置与第一存储配置不同。
- 知识图谱构建方法和装置-202080104019.4
- 叶现一 - 西门子(中国)有限公司
- 2020-09-10 - 2023-05-09 - G06F16/22
- 知识图谱构建方法和装置,该知识图谱构建方法包括:获取与用户数据涉及相同领域的训练数据;利用训练数据训练用于预测被输入属性值所属实体属性的分类模型;利用分类模型确定用户数据中每一列数据中各属性值所属的实体属性,并根据每一列数据中各属性值所属的实体属性确定该列数据所描述的实体属性;确定各列数据之间的映射关系;根据各列数据之间的映射关系及所描述的实体属性,确定各列数据所描述实体属性之间的映射关系;根据实体属性之间的映射关系及各实体属性所对应的实体,确定各实体之间的映射关系;生成包括有各实体之间映射关系的知识图谱。该方案使开发人员可以根据知识图谱快速确定用户数据所描述实体之间的关联关系。
- 列式分析存储格式的半结构化数据的概率文本索引-202180050173.2
- 温鉴;H·阿哈麦迪;S·金图卡尔;N·阿格尔沃;宛立建;S·哈里哈拉苏布拉曼尼安 - 甲骨文国际公司
- 2021-04-30 - 2023-04-28 - G06F16/22
- 本文是一种概率加索引技术,用于使用列式输入/输出(I/O)避免来搜索诸如Parquet之类的列式存储格式中的半结构化文本文档,并且需要最小的存储开销。在实施例中,计算机将列与半结构化文档中出现的文本串相关联。检测文本串中出现的文本词。分别为每个文本词生成多个位图中包含用于每一列的相应位的位图。基于位图中的至少一个位图,访问列中的一些列或半结构化文档中的一些半结构化文档。
- 聚类表的无混洗重新聚类-202180027769.0
- 章画;帕万·埃达拉;仁·阮 - 谷歌有限责任公司
- 2021-04-12 - 2023-04-04 - G06F16/22
- 一种用于聚类表(159)的无混洗重新聚类的方法(400),包括接收由聚类键值(154)排序的第一和第二组(158)聚类数据块(152)。第二组中的一个或多个数据块的聚类键值的范围与第一组中的数据块的聚类键值的范围重叠。该方法还包括生成用于将第一和第二组聚类数据块划分为第三组的分割点(310)。第三组中的每个数据块包括不与第三组中的任何其他数据块重叠的聚类键值的范围。每个分割点定义第三组中的数据块的聚类键值的范围的上限或下限。
- 具有子字典树数据结构的字典树数据结构-202180046205.1
- P·J·赫尔兰德 - 易享信息技术有限公司
- 2021-06-18 - 2023-03-28 - G06F16/22
- 本申请公开了涉及能够存储指示数据库键码的信息的树形数据结构的技术。计算机系统可以操作数据库。计算机系统可以存储能够用于针对数据库执行键码查找的多层级树形数据结构。在各种情况下,多层级树形数据结构可以在系统存储器中存储为多个子树形数据结构,每个子树形数据结构包括链接节点集合。多个子树形数据结构中给定的一个可以在系统存储器中存储为信息的相应连续块。计算机系统可以访问涵盖多层级树形数据结构中的特定层级范围的第一特定子树形数据结构的相应连续块。访问可以在没有访问涵盖特定层级范围内一个或多个层级的一个或多个其他子树形数据结构的情况下执行。
- 云数据库的弹性列式缓存-202180049302.6
- 安扬·库马尔·阿米里西特蒂;程讯;维拉尔·萨阿 - 谷歌有限责任公司
- 2021-05-04 - 2023-03-14 - G06F16/22
- 一种方法,包括接收缓存配置信息(22),缓存配置信息(22)指示与用户(12)相关联的缓存(160)的最大尺寸(24)和递增尺寸(26)。缓存被配置为以行为主的格式存储表(158)的一部分。该方法包括以列为主的格式将表的多个列(310)的子集缓存在缓存中,并且接收多个数据请求,数据请求请求访问表,并且与要求访问一个或多个列的对应访问模式(180)相关联。在执行一个或多个工作负载的同时,该方法包括:对于表的每一列,确定指示在预定时间段访问对应列的次数的访问频率(182),并基于访问模式、最大尺寸和递增尺寸来动态地调整列的子集。
- 实体解析系统中匹配字段的自动检测-202180048991.9
- N·R·辛格;A·赛斯;S·S·纳加纳;S·帕卡拉·斯里尼瓦斯 - 国际商业机器公司
- 2021-07-13 - 2023-03-14 - G06F16/22
- 提供了执行以下操作的方法、计算机程序产品和/或系统:获得有效负载属性字段;从有效负载属性字段确定潜在匹配字段;确定针对潜在匹配字段中的每一个的匹配函数;基于匹配函数来确定潜在匹配字段中的每个潜在匹配字段的属性得分;获得参考数据集合的得分列表;确定潜在匹配字段中的每一个的属性得分与参考数据集合得分列表的相关性;至少部分基于相关性从潜在匹配字段选择新匹配字段;确定所选择的新匹配字段中的每个新匹配字段的最佳权重;基于针对假肯定和假否定的阈值比率,从所选择的新匹配字段中选择用于匹配的属性字段;以及提供用于匹配的属性字段和针对属性字段的关联的最佳权重。
- 通过列式存储格式的全面位图索引进行高效扫描-202080101368.0
- 马继红;徐帅;蒋晓伟 - 阿里巴巴集团控股有限公司
- 2020-07-24 - 2023-02-03 - G06F16/22
- 提供了一种用于在数据分析存储引擎中执行查询的系统和方法。方法包括:接收查询以在数据分析存储引擎中定位目标数据,数据分析存储引擎包括:被划分为数据的一个或更多个分割的数据行,一个或更多个分割具有对应于数据行的数据列,以及嵌入在一个或更多个分割中的位图数据,其中位图数据与数据列相关联;以及使用一个或更多个分割中的位图数据定位目标数据。
- 无服务器数据湖索引子系统及应用编程接口-202180032980.1
- R·波塔拉朱;吴文涛;T·Y·金;L·诺维克;A·戴维 - 微软技术许可有限责任公司
- 2021-03-16 - 2022-12-30 - G06F16/22
- 本文描述了提供无服务器、多引擎、多用户数据湖索引子系统和应用编程接口的方法、系统和计算机程序产品。索引被定义为派生数据集,并且以通用格式存储在数据湖上,使不同的引擎能够创建和/或发现用于工作负荷优化的索引。索引的实施例经由包括在索引中并且存储在数据湖上的元数据来实现对索引的状态控制和管理。
- 对数据容器使用前缀删除操作-202180031613.X
- J·M·雅各布;D·博尔斯;G·S·拉姆达西 - 美光科技公司
- 2021-04-07 - 2022-12-09 - G06F16/22
- 将包括键和与所述键相关联的值的键值对存储在数据容器的当前片段中。所述键包括标识所述当前片段的片段标识符。所述数据容器包括驻留在非易失性存储器装置上的多个片段。响应于确定所述当前片段的大小超过阈值,将新片段添加到所述容器。删除具有参考所述数据容器的一或多个创建最久的片段的相应当前片段标识符的所述多个键值对。
- 用于使用分布式账本跟踪数据沿袭和记录生命周期的系统和方法-202180012992.8
- A·G·林奇;Z·卡尔马;A·蒂瓦里 - 摩根大通国家银行
- 2021-01-08 - 2022-10-11 - G06F16/22
- 公开了用于使用分布式账本跟踪数据沿袭和记录生命周期的系统和方法。在一个实施例中,用于跟踪记录生命周期事件的方法可以包括:(1)通过记录生命周期工具为记录生命周期中的记录生命周期事件创建可记录制造物,该可记录制造物包括用于记录生命周期事件的数据;(2)通过记录生命周期工具生成数据的散列;(3)通过记录生命周期工具为可记录制造物创建记录生命周期事件元数据;(4)通过记录生命周期工具对记录生命周期事件元数据进行签名;(5)将记录生命周期事件元数据在存储位置处写入供应链元数据存储装置,其中供应链元数据存储装置可以是加密可验证且不可变的;以及(6)将散列和用于供应链元数据存储装置中的存储位置的标识符写入当前状态数据库。
- 用于搜索服务的暖层存储-202080082996.9
- 罗摩克里希纳·科特拉;伊莱·R·费希尔;周民;安基特·马尔帕尼;安基特·库马尔·简;安迪·古特曼斯;巴文·阿瓦拉尼 - 亚马逊技术有限公司
- 2020-11-23 - 2022-09-09 - G06F16/22
- 本文中描述了用于由计算资源服务提供者的搜索服务访问的客户数据的分层存储的系统和技术。在一些方面,客户数据可以由跨多个计算节点执行并由搜索服务预配的搜索实例接收。可以对所述客户数据编索引,并且可以通过所述搜索实例的第一热计算节点池在本地存储所述数据和所得索引。所述客户数据和索引可以被迁移和由数据存储服务远程地存储。与所述客户数据和/或索引相关联的元数据可以存储在所述搜索实例的第二暖计算节点池中。暖计算节点在接收到访问所述客户数据的请求时,可以识别所述客户数据的位置并根据所述元数据从所述数据存储服务检索所述客户数据。
- 使用以选择性数据存储格式进行日志记录的键值存储-201980082310.3
- S·库里奇亚斯;G·A·贝克尔;D·博尔斯;S·莫耶;N·梅拉莫希丁·穆罕默德;A·汤姆林森 - 美光科技公司
- 2019-12-11 - 2022-08-05 - G06F16/22
- 本公开的方面提供使用日志记录的键值存储KVS的操作,其中数据(例如,键值对的键数据或值数据)存储在基于一或多个准则选择的不同类型的数据存储对象(例如,数据存储格式)中。
- 用于快速数据检索的通用数据索引-202080080624.2
- 斯蒂芬·塔尔博特;柯林·泽玛 - 谷歌有限责任公司
- 2020-11-19 - 2022-07-08 - G06F16/22
- 一种通用数据索引构建方法,包括通过所述数据库管理系统(250)建立与所述数据库(100,240)的通信耦合。该方法还包括在所述宿主计算机(230)的存储器中的所述索引(170,270)中创建数据库的所有列中的所述字段值(120A,120B,120N)与数据库的列的所有所述元数据(130A,130B,130N)的并集(150A,150B)。在这点上,索引将每个值和每个元数据与数据库中的特定位置相关联。该方法还包括向索引中添加成对字段值(160A,160B,160N)作为共现列表(180)。最后,该方法包括向索引发出查询,而不向数据库管理系统发出SQL WHERE语句,以便产生筛选的查询结果(100C)。
- 能够选择性使用键部分的键值存储树-201980083131.1
- A·汤姆林森 - 美光科技公司
- 2019-12-11 - 2022-06-17 - G06F16/22
- 本公开的各方面提供例如当在键值存储(KVS)树数据结构内存储键值对(与键相关联)或浏览所述KVS树数据结构时相对于所述KVS树数据结构选择性地使用所述键的一部分的各种实施例,所述部分例如是所述键的前缀(也被称作键的键前缀)。对于一些实施例,当基于键浏览KVS树时,KVS树的第一组层级(例如,第一系列层级)通过所述键的第一部分(例如,前缀)浏览,且KVS树的第二组层级(例如,第二系列层级)通过所述键的第二部分(例如,整个部分)浏览。
- 利用压缩的键值存储树数据块溢出-201980077140.X
- A·汤姆林森;G·A·贝克尔;G·S·拉姆达西 - 美光科技公司
- 2019-10-02 - 2022-04-05 - G06F16/22
- 本公开的各方面提供对键值树数据结构的操作:通过合并且重写给定节点内的键值组的键块、同时基于所述给定节点的一或多个子节点是否包括叶节点而重写或推迟重写经合并键值组的值块来合并所述键值组;以及将所述经合并键值组的一或多个部分移动到所述给定节点的一或多个子节点。
- 电子表单表转换-201980099111.3
- 董浩宇;韩石;张冬梅;J·M·哈尔贝斯塔姆;吕潇 - 微软技术许可有限责任公司
- 2019-08-08 - 2022-03-18 - G06F16/22
- 提供了一种用于电子表单表转换的方案。在该方案中,检测电子表单表的至少一个表头区域和数据区域。通过分析表头区域中的单元合并和/或缩进、和/或数据区域的对应单元中的数据项之间的函数关系,确定表头区域中每个表头区域的层级结构。基于对表头区域的层级结构的识别,电子表单表能够被转换为关系表。以此方式,基于表头层级来辅助理解表头结构,可以实现从电子表单表向关系表的自动转换。
- 管理对数字资产的访问-202080032673.9
- T·萨克森;B·斯帕尔 - 索尼集团公司;索尼音乐娱乐公司
- 2020-05-08 - 2021-12-10 - G06F16/22
- 在与移动设备通信的服务器系统处管理对数字内容的访问,包括:从移动设备接收用户账户标识符和表现信息;访问存储可收集记录的可收集数据库;将接收的表现信息与可收集记录中的表现信息进行比较;访问存储用户账户记录的用户账户数据库;将所检索的可收集标识符添加到所识别的用户账户记录中;从所识别的可收集记录中检索音乐相关资产标识符;和向所述移动设备发送确认,所述确认指示可收集资产已经被收集,并且指示检索到的音乐相关资产标识符。
- 链接和编写工作表-202080023027.6
- 詹姆斯·L·盖尔;肯尼思·特龙;马克斯·H·塞登;詹森·D·弗朗茨 - 西格玛计算机有限公司
- 2020-03-19 - 2021-11-05 - G06F16/22
- 链接和编写工作表包括:接收创建从数据源工作表链接的引用工作表的请求,其中所述数据源工作表是来自数据库的数据集的呈现;使用对所述请求中的所述数据源工作表元数据的引用来检索数据源工作表元数据;以及使用所述数据源工作表元数据创建所述引用工作表,所述引用工作表呈现由所述数据源工作表呈现的所述数据集的至少一个子集,其中创建所述引用工作表包括:使用在所述请求中接收到的所述数据源工作表元数据和引用工作表元数据生成数据库查询;以及向所述数据库发出所述数据库查询。
- 数据库索引确定和验证-201980088776.4
- S·达斯;V·R·纳拉萨雅;许高翔;S·乔杜里;A·乔瓦诺维克;M·拉杜罗威克 - 微软技术许可有限责任公司
- 2019-12-23 - 2021-11-02 - G06F16/22
- 用于重组数据库的数据的物理布局的系统、方法和计算机可执行指令。工作负载从先前执行的数据库操作中被选择。先前执行的数据库操作和工作负载的总资源消耗被确定。工作负载的总资源消耗大于先前执行的数据库操作的总资源消耗的预定阈值。用于数据库的优化操作是使用工作负载而被确定的。数据库的克隆数据库被创建。对克隆数据库执行优化操作。针对数据库的数据库操作被接收。对数据库和克隆数据库执行数据库操作。基于对数据库和克隆数据库的数据库操作的执行,与数据库的性能相比,验证克隆数据库的性能被改进。
- 用于处理大宽数据的过程控制工具-201980091998.1
- T·希尔;D·卡茨;P·斯莫林斯基;S·拉马林加姆;S·希利安 - 泰必高软件公司
- 2019-12-13 - 2021-10-19 - G06F16/22
- 一种用于处理来自自动化制造操作的宽数据的过程控制工具。该工具包括特征选择器、分析服务器和可视化引擎。特征选择器从至少一个制造过程应用中接收过程输入数据,其中过程输入数据包括多个观察值和相关联的变量,将所接收的过程输入数据转换成在每个观察值中针对每个变量具有一行的堆叠格式,将所标识的类别变量转换成数字变量,并且将所标识的时间序列数据转换成固定数量的区间,计算对预测因子值与结果变量之间的关系的强度进行测量的统计数据,对预测因子值进行排序、过滤、以及旋转。分析服务器执行至少一个操作,以标识过滤后的预测因子值中的预测因子值之间的交互,例如使用最大似然计算或预定义搜索。可视化引擎显示交互以用于管理制造操作。
- 用于管理交通工具数据的系统和方法-201980088405.6
- 埃万盖洛斯·斯莫迪斯 - 埃万盖洛斯·斯莫迪斯
- 2019-11-06 - 2021-08-17 - G06F16/22
- 本公开提供了用于管理自动驾驶交通工具数据的方法和系统。该方法可以包括:(a)从自动驾驶交通工具收集所述自动驾驶交通工具数据,其中自动驾驶交通工具数据具有至少为1太字节的大小;(b)处理所述自动驾驶交通工具数据以生成与所述自动驾驶交通工具数据相对应的元数据,其中所述自动驾驶交通工具数据被存储在数据库中;(c)使用元数据的至少一部分从数据库中检索自动驾驶交通工具数据的子集,该自动驾驶交通工具数据的子集具有小于自动驾驶交通工具数据的大小;并且(d)存储或传输自动驾驶交通工具数据的子集。
- 微服务数据聚合搜索引擎更新-201980087331.4
- G·罗伊;S·阿纳夫卡尔;T·万瓦拉;S·高欣迪卡尔 - 惠普发展公司;有限责任合伙企业
- 2019-04-27 - 2021-08-06 - G06F16/22
- 一种用于更新数据视图的数据的方法。所述数据分布在多个微服务数据库中并且被聚合在数据聚合搜索引擎索引中。用户做出更新数据视图的数据的请求。响应于更新请求,执行即时数据更新操作,以更新所述多个微服务数据库中的一个或多个中的数据。使用更改队列以更新所述数据聚合搜索引擎索引中的聚合数据。
- 使用多个GPU对散列表有效且可扩展地构建和探测-201980083821.7
- T·卡尔德魏;J·J·克劳斯;N·萨哈尼赫 - 辉达公司
- 2019-10-17 - 2021-08-06 - G06F16/22
- 所描述的方法提供了使用多个GPU来有效地且可扩展地构建和探测散列表并物化探测的结果。由GPU进行的用于构建和/或探测散列表的随机存储器访问可以分布在GPU上并且使用全局位置标识符并发地执行。全局位置标识符可从条目的数据计算并使用该条目来标识用于插入和/或探测的全局位置。全局位置标识符可由GPU使用以确定是否使用条目执行插入或探测和/或在哪里执行插入或探测。为了在物化探测散列表的结果时协调GPU,可以在GPU中的每个GPU可访问的存储器中维护到全局输出缓冲区的全局偏移,或者GPU可以使用本地输出缓冲区大小的排他和来计算全局偏移。
- 全面支持自主JSON文档对象(AJD)云服务的技术-201980084880.6
- 刘振华;V·阿罗拉;吕颖;S·克里希纳穆尔蒂;H·J·张;B·C·哈默施密特;J·J·施皮格尔 - 甲骨文国际公司
- 2019-12-18 - 2021-08-06 - G06F16/22
- 本发明涉及数据库中文档的数据网格的自主调谐。本文是用于存储单元格自主维护本地索引以及其它优化元数据和算法以加速对文档的分布式集合的选择性访问的技术。在实施例中,每个存储单元格持久化文档的相应子集。每个存储单元格在存储器中存储将每个项目映射到相应文档子集的一个或多个文档中该项目出现的(一个或多个)位置的(一个或多个)相应索引。一个或多个计算机至少基于存储单元格的索引的子集来执行来自数据库管理系统的数据访问请求。在实施例中,JSON文档服务的云提供易于使用的、完全自主的JSON文档数据库,该数据库可以水平和弹性地伸缩以交付文档事务和查询的快速执行,而无需数据库管理员进行调谐。
- 专利分类