[发明专利]根据数据字段的语义标签生成用于数据字段的数据处理值的规则在审
申请号: | 202180022638.3 | 申请日: | 2021-02-25 |
公开(公告)号: | CN115380281A | 公开(公告)日: | 2022-11-22 |
发明(设计)人: | 约翰·乔伊斯;马歇尔·A·伊斯曼;S·梅尔布希 | 申请(专利权)人: | 起元技术有限责任公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215 |
代理公司: | 北京林达刘知识产权代理事务所(普通合伙) 11277 | 代理人: | 刘新宇 |
地址: | 美国马*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本公开的方法和系统被配置为确定数据的语义含义,并且基于该数据的该语义含义生成数据处理规则。该语义含义包括该数据的语法含义或上下文含义,该数据例如通过由数据处理系统对存储在字段中的值进行建档来确定,该字段被包括在一个或多个数据集的数据记录中;由该数据处理系统将一个或多个分类器应用于该经建档的值;基于应用该一个或多个分类器识别指示该字段的这些值的逻辑特性或语法特性的一个或多个属性,其中该一个或多个属性中的每个属性具有基于该一个或多个分类器中的每个分类器的输出的相应置信度水平。这些属性与这些字段相关联,并且用于生成数据处理规则以及用于处理数据。 | ||
搜索关键词: | 根据 数据 字段 语义 标签 生成 用于 数据处理 规则 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于起元技术有限责任公司,未经起元技术有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202180022638.3/,转载请声明来源钻瓜专利网。
- 上一篇:电化学装置用负极及电化学装置
- 下一篇:多孔性膜、二次电池用隔板及二次电池
- 同类专利
- 数据集成背景中的标准化-202280016349.7
- N·卡布拉;K·K·博纳吉里;M·W·格拉塞尔特;Y·萨耶 - 国际商业机器公司
- 2022-02-18 - 2023-10-13 - G06F16/215
- 描述了涉及云计算环境的管理服务域中的自动数据标准化的技术。一种相关联的计算机实现的方法,包括在数据载入过程期间接收数据集,以及对数据集内的数据点进行分类。该方法还包括将机器学习数据标准化模型应用于数据集内的每个分类的数据点,以及基于因模型应用而确定的任何标准化修改得到针对数据集的所提出的数据标准化规则集。可选地,该方法包括呈现所提出的数据标准化规则集用于客户端审阅,以及响应于接受所提出的数据标准化规则集,将所提出的数据标准化规则集应用于数据集。该方法进一步包括:响应于接受所提出的数据标准化规则集,相应地更新机器学习数据标准化模型。
- 实现弹性确定性加密-202180082513.X
- G·A·雅克塔;D·哈尼克;W·J·斯凯尔斯 - 国际商业机器公司
- 2021-11-04 - 2023-08-22 - G06F16/215
- 一种计算机实现的方法,包括:利用明文实例和机密秘钥来创建初始化向量;利用初始化向量、机密密钥和明文实例对明文实例进行加密;将初始化向量与经加密的明文实例组合以创建密文串;以及向执行去重的存储设备发送密文串。
- 信息处理程序、信息处理方法以及信息处理装置-202080107932.X
- 上村健人;小柳佑介;大堀耕太郎 - 富士通株式会社
- 2020-12-16 - 2023-08-08 - G06F16/215
- 本发明提供实现用于目的达成的行动提示的合理化的信息处理程序、信息处理方法以及信息处理装置。使计算机执行以下的处理。对于分别是包含表示对象的特征的不变特征量以及可变特征量的多个特征量的组合的多个组合数据,根据各组合数据间的关系性,基于多个组合数据提取处理对象的组合数据。使用处理对象的组合数据,根据不变特征量执行针对可变特征量的因果搜索处理。基于因果搜索处理的结果,选择并提示与指定的不变特征量对应的特定的可变特征量。
- 在无共享分布式数据库中快速检测和修复故障的系统和方法-202180070442.1
- W·H·小布里奇;D·布罗尔;M·许;B·克洛茨;N·J·S·迈克诺顿;A·米拉瓦拉普;U·潘查克沙拉雅;G·F·斯沃特;T·拉希里;J·R·洛埃扎 - 甲骨文国际公司
- 2021-10-06 - 2023-08-01 - G06F16/215
- 提供了一种无共享数据库系统,其中每个表的行被指派给“切片”,并且每个切片的多个副本(“复本”)跨多个节点的持久存储装置存储。从表的特定行读取数据的请求可以由存储该行所指派到的切片的复本的任何节点处置。对于每个切片,切片的单个复本被指定为“主复本”。所有DML操作都由具有目标行所指派到的切片的主复本的节点执行。然后将改变传播到同一切片的其它复本(“二级复本”)。
- 数据模型的计算机自动分析和验证系统-202180058994.0
- 特雷西·L·霍坦恩·克里尔 - 西格纳知识产权公司
- 2021-07-07 - 2023-05-30 - G06F16/215
- 一种系统包括处理器和存储指令的存储器。所述指令包括,响应于从用户设备接收到指示第一数据模型的第一输入,获得第一数据模型并识别第一数据模型内的多个对象。所述指令包括获得一组规则,并且对于所述一组规则中的每个规则,将该规则应用于每个对象以确定该对象对该规则的遵守或该对象对该规则的违反。所述指令包括生成报告,该报告针对每个规则和每个对象指示该对象对该规则的遵守或该对象对该规则的违反,并基于所述多个对象对所述一组规则的总体遵守来计算遵守分值。所述指令包括发送所生成的报告和遵守分值以在用户设备上显示。
- 实时数据质量分析-202180059002.6
- A·伊因加;A·巴米迪佩蒂;D·帕特尔;S·什里瓦斯塔瓦;周念军 - 国际商业机器公司
- 2021-07-07 - 2023-05-23 - G06F16/215
- 用于评估数据质量的计算机实现的方法包括使用处理器来接收对数据流中的数据点的多个更新。处理器还用于从数据流中的数据点计算数据质量度量(DQM)的实例。DQM的实例被配置为根据时间来区分数据流中的数据点,并且向根据数据流中的较新数据点计算的DQM的实例分配较高权重。当处理器接收到更多数据点时,DQM的实例被连续更新,同时将通过更新DQM的实例所消耗的处理器的周期限制到阈值。
- 使用语义角色的数据准备-202080078301.X
- 瑞恩·安德鲁·阿塔拉 - 塔谱软件公司
- 2020-09-30 - 2023-05-09 - G06F16/215
- 一种准备数据以用于后续分析的方法。该方法获得将数据源编码为逻辑表的树的数据模型。每个逻辑表有其自己的物理表示,并包括逻辑字段。每个逻辑字段对应于跨逻辑表的数据字段或计算。该方法将数据模型中的每个逻辑表与概念图中的对应概念相关联。概念图体现了语义的层次继承。对于每个逻辑字段,该方法基于对应于逻辑表的概念为逻辑字段分派语义角色。该方法还基于逻辑字段的语义角色对逻辑字段进行验证。该方法还显示转换,以基于对逻辑字段的验证来清理逻辑字段。该方法根据用户选择转换逻辑字段,并更新逻辑表。
- 使用合格关系得分的主数据的改进的实体解析-202180048046.9
- G.S.普利帕蒂;C.A.伊耶;P.拉玛林加姆;S.帕卡拉斯里尼瓦斯 - 国际商业机器公司
- 2021-07-06 - 2023-03-14 - G06F16/215
- 接收与MDM系统的主数据的多个实体的实体记录之间的匹配相关联的第一得分。具有高于下阈值得分和低于上阈值得分的第一得分的一组实体记录被识别为未解析;未被确认为匹配或未匹配。生成与实体记录之间的关系相关联的第二得分。通过组合第一匹配得分与第二关系得分来确定该组实体记录的配对的总得分。将所述一组实体中的相应配对的总得分与所述上阈值进行比较,并且如果超过所述上阈值,则将所述一组实体记录中的所述实体记录对的信息组合到单个记录中,并且从MDM系统移除冗余实体记录。
- 上下文驱动的数据剖析-202180041734.2
- 萨蒂恩德·戈埃尔;奥尔科·乔希;维姬·弗罗伊恩;阿普万·查赫拉;彼得·德·莱恩希尔;詹姆斯·B·库什曼 - 科里布拉有限责任公司
- 2021-04-09 - 2023-02-03 - G06F16/215
- 本公开涉及经由数据剖析过程处理数据的方法和系统。数据剖析可以包括修改源数据中包含的属性和标识源数据的方面。数据剖析过程可以包括根据一组校验规则处理属性,以校验属性中包含的信息。过程还可以包括根据一组标准化规则处理属性,以将属性修改为标准化格式。过程还可以包括根据一组规则引擎处理属性。可以输出经修改的属性以供进一步处理。数据剖析过程还可以包括得出属性的价值分数和使用排名,其可用于得出对源数据的洞察。
- 用于处理数据记录的方法和系统-202180036821.9
- L.布雷默;J.罗斯纳;C.凡科尼;M.奥伯霍弗;K.斯特克勒 - 国际商业机器公司
- 2021-04-16 - 2023-01-31 - G06F16/215
- 本公开涉及一种方法,包括:提供一个或多个记录的集合,记录的集合中的每个记录具有一个或多个属性的集合,将记录的集合的属性的集合的值输入到经训练的数据表示学习模型,从而接收分别表示记录的集合的特征向量的集合作为经训练的数据表示学习模型的输出,并且存储特征向量的集合。
- 根据数据字段的语义标签生成用于数据字段的数据处理值的规则-202180022638.3
- 约翰·乔伊斯;马歇尔·A·伊斯曼;S·梅尔布希 - 起元技术有限责任公司
- 2021-02-25 - 2022-11-22 - G06F16/215
- 本公开的方法和系统被配置为确定数据的语义含义,并且基于该数据的该语义含义生成数据处理规则。该语义含义包括该数据的语法含义或上下文含义,该数据例如通过由数据处理系统对存储在字段中的值进行建档来确定,该字段被包括在一个或多个数据集的数据记录中;由该数据处理系统将一个或多个分类器应用于该经建档的值;基于应用该一个或多个分类器识别指示该字段的这些值的逻辑特性或语法特性的一个或多个属性,其中该一个或多个属性中的每个属性具有基于该一个或多个分类器中的每个分类器的输出的相应置信度水平。这些属性与这些字段相关联,并且用于生成数据处理规则以及用于处理数据。
- 用于填充缺失的工业纵向数据的方法和设备-202080097170.X
- 周林飞;李晶;丹尼尔·施尼盖斯;田鹏伟 - 西门子股份公司
- 2020-02-21 - 2022-10-04 - G06F16/215
- 本发明呈现一种用于填充缺失的工业纵向数据的方法、设备、系统和计算机可读介质。与当前线性回归或内插相比,将切片视为整体,还考虑切片随时间的趋势,以此方式可以更有意义的方式填充缺失数据且反映真实物理状态。
- 数据处理方法及相关产品-202080094736.3
- 曾焕生;赖延辉 - 深圳市欢太科技有限公司;OPPO广东移动通信有限公司
- 2020-03-09 - 2022-09-02 - G06F16/215
- 一种数据处理方法及相关产品,应用于电子设备,该方法包括:获取待处理数据集,所述待处理数据集包括多个数据,每一数据对应一个时间戳(101);在RocksDB存储引擎运行时,获取当前时间戳(102);将所述当前时间戳与所述多个数据中每一数据对应的时间戳进行比对,得到至少一个目标时间戳(103);删除所述至少一个目标时间戳对应的数据,并将所述待多个数据中的剩余数据进行合并,得到目标数据集(104)。该方法能够提升数据删除效率,有助于提升系统性能。
- 受保护数据上的分布式隐私保护计算-202080039647.9
- R·卡尔库特;M·布卢姆;J·赫斯;R·D·罗杰斯;S·哈芒德;M·E·查尔克 - 加利福尼亚大学董事会
- 2020-03-26 - 2022-01-04 - G06F16/215
- 本公开涉及通过将分析分发到受隐私保护的协调数据的多个源来开发人工智能算法的技术。具体地,各方面涉及一种计算机实现的方法,该方法包括接收算法和与该算法相关联的输入数据需求,基于输入数据需求将数据资产识别为可从数据主机获得,在数据主机基础设施内的数据存储结构内编策数据资产,并将算法集成到安全封装体计算框架中。安全封装体计算框架以保护数据资产和算法隐私的安全方式使算法服务于数据存储结构内的数据资产。计算机实现的方法进一步包括通过算法运行数据资产以获得推断。
- 用于为临床试验提供记录选择的基于地理聚类数据的数据库缩减-202080028134.8
- S·M·琼斯;M·L·琼斯;M·B·加西亚;E·M·玛莎尔丝;R·黑格 - 美国控股实验室公司
- 2020-04-07 - 2021-11-26 - G06F16/215
- 各方面和特征涉及在计算上缩减数据库的尺寸或复杂性,以便提高计算系统处理这种数据库的速度和效率,以便识别临床试验的研究者。在一些方面,处理设备执行的操作包括识别地理聚类数据的数据源,该地理聚类数据包含数据库记录的对应描述符。操作还包括格式化对应描述符以产生标准化的对应描述符,以及匹配每个标准化的对应描述符以产生该描述符的记录分数。可以组合记录分数以产生每条数据库记录的总分数,并且可以基于总分数选择数据库记录并将其写入到数据存储库。
- 链接和处理不同的知识图-202080017035.X
- S·勒维扎;F·弗勒特尔;F·格拉夫;E·吕格尔;A·乔万尼尼 - 国际商业机器公司
- 2020-02-19 - 2021-10-08 - G06F16/215
- 提供了一种用于在存在第三知识图(KG)的情况下链接第一KG和第二KG的方法。将第一KG的节点的内容与第二KG的节点进行比较。如果第一KG节点与相关的第二KG节点具有内容关系,则在元层KG中存储由识别第一KG和第一KG节点的元组以及识别第二KG和第二KG节点的元组识别的边。所述方法包括将来自第三KG的节点的内容与来自第一KG和第二KG的节点的内容进行比较,并且在识别出关系的情况下,存储在元层中建立该关系的更复杂的元组。最后,该方法还包括存储元层知识图的至少所有节点和边。
- 将事件标识为数据质量异常的根本原因的系统和方法-201880100130.9
- S·米什拉;S·R·希萨里娅;M·米里根克;N·K·那伊康达 - 维萨国际服务协会
- 2018-12-19 - 2021-07-23 - G06F16/215
- 实施例检测和预测数据仓库中的数据差异问题。实施例导出关于在所述数据差异之前发生的事件的有意义洞察发现,并关联所述事件以理解所述数据差异的根本原因(或由于检测到所述数据差异而生成的警示的根本原因)。实施例采取或推荐可操作措施来预防被标识为所述根本原因的所述事件的进一步发生。根据各种实施例,当受监测数据是交易数据(例如交易量、交易金额、交易处理速度等)时,内部事件(例如数据作业失败、作业延迟、作业服务器维护)或外部事件(例如季节性假期事件、自然灾害)可引起所述交易数据的下落或突增,从而导致数据质量异常(即,数据差异)。
- 分布式分类账中基于DAG的交易处理方法和系统-201980055454.X
- 杨宝华 - 甲骨文国际公司
- 2019-02-01 - 2021-04-02 - G06F16/215
- 本文描述了用于分布式分类账中基于DAG的交易处理系统和方法的系统和方法。根据实施例,可以引入分布式分类账中基于DAG的交易处理系统和方法。该模型可以帮助实现提高的吞吐量性能。借助附加的权重机制,可以基于各种业务需求来调整最终性能。这与使用线性结构的现有工作不同,并且可以实现更好的性能。
- 专利分类
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置