[发明专利]根据数据字段的语义标签生成用于数据字段的数据处理值的规则在审

专利信息
申请号: 202180022638.3 申请日: 2021-02-25
公开(公告)号: CN115380281A 公开(公告)日: 2022-11-22
发明(设计)人: 约翰·乔伊斯;马歇尔·A·伊斯曼;S·梅尔布希 申请(专利权)人: 起元技术有限责任公司
主分类号: G06F16/215 分类号: G06F16/215
代理公司: 北京林达刘知识产权代理事务所(普通合伙) 11277 代理人: 刘新宇
地址: 美国马*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要: 本公开的方法和系统被配置为确定数据的语义含义,并且基于该数据的该语义含义生成数据处理规则。该语义含义包括该数据的语法含义或上下文含义,该数据例如通过由数据处理系统对存储在字段中的值进行建档来确定,该字段被包括在一个或多个数据集的数据记录中;由该数据处理系统将一个或多个分类器应用于该经建档的值;基于应用该一个或多个分类器识别指示该字段的这些值的逻辑特性或语法特性的一个或多个属性,其中该一个或多个属性中的每个属性具有基于该一个或多个分类器中的每个分类器的输出的相应置信度水平。这些属性与这些字段相关联,并且用于生成数据处理规则以及用于处理数据。
搜索关键词: 根据 数据 字段 语义 标签 生成 用于 数据处理 规则
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于起元技术有限责任公司,未经起元技术有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202180022638.3/,转载请声明来源钻瓜专利网。

同类专利
  • 数据集成背景中的标准化-202280016349.7
  • N·卡布拉;K·K·博纳吉里;M·W·格拉塞尔特;Y·萨耶 - 国际商业机器公司
  • 2022-02-18 - 2023-10-13 - G06F16/215
  • 描述了涉及云计算环境的管理服务域中的自动数据标准化的技术。一种相关联的计算机实现的方法,包括在数据载入过程期间接收数据集,以及对数据集内的数据点进行分类。该方法还包括将机器学习数据标准化模型应用于数据集内的每个分类的数据点,以及基于因模型应用而确定的任何标准化修改得到针对数据集的所提出的数据标准化规则集。可选地,该方法包括呈现所提出的数据标准化规则集用于客户端审阅,以及响应于接受所提出的数据标准化规则集,将所提出的数据标准化规则集应用于数据集。该方法进一步包括:响应于接受所提出的数据标准化规则集,相应地更新机器学习数据标准化模型。
  • 信息处理程序、信息处理方法以及信息处理装置-202080107932.X
  • 上村健人;小柳佑介;大堀耕太郎 - 富士通株式会社
  • 2020-12-16 - 2023-08-08 - G06F16/215
  • 本发明提供实现用于目的达成的行动提示的合理化的信息处理程序、信息处理方法以及信息处理装置。使计算机执行以下的处理。对于分别是包含表示对象的特征的不变特征量以及可变特征量的多个特征量的组合的多个组合数据,根据各组合数据间的关系性,基于多个组合数据提取处理对象的组合数据。使用处理对象的组合数据,根据不变特征量执行针对可变特征量的因果搜索处理。基于因果搜索处理的结果,选择并提示与指定的不变特征量对应的特定的可变特征量。
  • 数据模型的计算机自动分析和验证系统-202180058994.0
  • 特雷西·L·霍坦恩·克里尔 - 西格纳知识产权公司
  • 2021-07-07 - 2023-05-30 - G06F16/215
  • 一种系统包括处理器和存储指令的存储器。所述指令包括,响应于从用户设备接收到指示第一数据模型的第一输入,获得第一数据模型并识别第一数据模型内的多个对象。所述指令包括获得一组规则,并且对于所述一组规则中的每个规则,将该规则应用于每个对象以确定该对象对该规则的遵守或该对象对该规则的违反。所述指令包括生成报告,该报告针对每个规则和每个对象指示该对象对该规则的遵守或该对象对该规则的违反,并基于所述多个对象对所述一组规则的总体遵守来计算遵守分值。所述指令包括发送所生成的报告和遵守分值以在用户设备上显示。
  • 实时数据质量分析-202180059002.6
  • A·伊因加;A·巴米迪佩蒂;D·帕特尔;S·什里瓦斯塔瓦;周念军 - 国际商业机器公司
  • 2021-07-07 - 2023-05-23 - G06F16/215
  • 用于评估数据质量的计算机实现的方法包括使用处理器来接收对数据流中的数据点的多个更新。处理器还用于从数据流中的数据点计算数据质量度量(DQM)的实例。DQM的实例被配置为根据时间来区分数据流中的数据点,并且向根据数据流中的较新数据点计算的DQM的实例分配较高权重。当处理器接收到更多数据点时,DQM的实例被连续更新,同时将通过更新DQM的实例所消耗的处理器的周期限制到阈值。
  • 使用语义角色的数据准备-202080078301.X
  • 瑞恩·安德鲁·阿塔拉 - 塔谱软件公司
  • 2020-09-30 - 2023-05-09 - G06F16/215
  • 一种准备数据以用于后续分析的方法。该方法获得将数据源编码为逻辑表的树的数据模型。每个逻辑表有其自己的物理表示,并包括逻辑字段。每个逻辑字段对应于跨逻辑表的数据字段或计算。该方法将数据模型中的每个逻辑表与概念图中的对应概念相关联。概念图体现了语义的层次继承。对于每个逻辑字段,该方法基于对应于逻辑表的概念为逻辑字段分派语义角色。该方法还基于逻辑字段的语义角色对逻辑字段进行验证。该方法还显示转换,以基于对逻辑字段的验证来清理逻辑字段。该方法根据用户选择转换逻辑字段,并更新逻辑表。
  • 使用合格关系得分的主数据的改进的实体解析-202180048046.9
  • G.S.普利帕蒂;C.A.伊耶;P.拉玛林加姆;S.帕卡拉斯里尼瓦斯 - 国际商业机器公司
  • 2021-07-06 - 2023-03-14 - G06F16/215
  • 接收与MDM系统的主数据的多个实体的实体记录之间的匹配相关联的第一得分。具有高于下阈值得分和低于上阈值得分的第一得分的一组实体记录被识别为未解析;未被确认为匹配或未匹配。生成与实体记录之间的关系相关联的第二得分。通过组合第一匹配得分与第二关系得分来确定该组实体记录的配对的总得分。将所述一组实体中的相应配对的总得分与所述上阈值进行比较,并且如果超过所述上阈值,则将所述一组实体记录中的所述实体记录对的信息组合到单个记录中,并且从MDM系统移除冗余实体记录。
  • 根据数据字段的语义标签生成用于数据字段的数据处理值的规则-202180022638.3
  • 约翰·乔伊斯;马歇尔·A·伊斯曼;S·梅尔布希 - 起元技术有限责任公司
  • 2021-02-25 - 2022-11-22 - G06F16/215
  • 本公开的方法和系统被配置为确定数据的语义含义,并且基于该数据的该语义含义生成数据处理规则。该语义含义包括该数据的语法含义或上下文含义,该数据例如通过由数据处理系统对存储在字段中的值进行建档来确定,该字段被包括在一个或多个数据集的数据记录中;由该数据处理系统将一个或多个分类器应用于该经建档的值;基于应用该一个或多个分类器识别指示该字段的这些值的逻辑特性或语法特性的一个或多个属性,其中该一个或多个属性中的每个属性具有基于该一个或多个分类器中的每个分类器的输出的相应置信度水平。这些属性与这些字段相关联,并且用于生成数据处理规则以及用于处理数据。
  • 数据处理方法及相关产品-202080094736.3
  • 曾焕生;赖延辉 - 深圳市欢太科技有限公司;OPPO广东移动通信有限公司
  • 2020-03-09 - 2022-09-02 - G06F16/215
  • 一种数据处理方法及相关产品,应用于电子设备,该方法包括:获取待处理数据集,所述待处理数据集包括多个数据,每一数据对应一个时间戳(101);在RocksDB存储引擎运行时,获取当前时间戳(102);将所述当前时间戳与所述多个数据中每一数据对应的时间戳进行比对,得到至少一个目标时间戳(103);删除所述至少一个目标时间戳对应的数据,并将所述待多个数据中的剩余数据进行合并,得到目标数据集(104)。该方法能够提升数据删除效率,有助于提升系统性能。
  • 受保护数据上的分布式隐私保护计算-202080039647.9
  • R·卡尔库特;M·布卢姆;J·赫斯;R·D·罗杰斯;S·哈芒德;M·E·查尔克 - 加利福尼亚大学董事会
  • 2020-03-26 - 2022-01-04 - G06F16/215
  • 本公开涉及通过将分析分发到受隐私保护的协调数据的多个源来开发人工智能算法的技术。具体地,各方面涉及一种计算机实现的方法,该方法包括接收算法和与该算法相关联的输入数据需求,基于输入数据需求将数据资产识别为可从数据主机获得,在数据主机基础设施内的数据存储结构内编策数据资产,并将算法集成到安全封装体计算框架中。安全封装体计算框架以保护数据资产和算法隐私的安全方式使算法服务于数据存储结构内的数据资产。计算机实现的方法进一步包括通过算法运行数据资产以获得推断。
  • 链接和处理不同的知识图-202080017035.X
  • S·勒维扎;F·弗勒特尔;F·格拉夫;E·吕格尔;A·乔万尼尼 - 国际商业机器公司
  • 2020-02-19 - 2021-10-08 - G06F16/215
  • 提供了一种用于在存在第三知识图(KG)的情况下链接第一KG和第二KG的方法。将第一KG的节点的内容与第二KG的节点进行比较。如果第一KG节点与相关的第二KG节点具有内容关系,则在元层KG中存储由识别第一KG和第一KG节点的元组以及识别第二KG和第二KG节点的元组识别的边。所述方法包括将来自第三KG的节点的内容与来自第一KG和第二KG的节点的内容进行比较,并且在识别出关系的情况下,存储在元层中建立该关系的更复杂的元组。最后,该方法还包括存储元层知识图的至少所有节点和边。
  • 将事件标识为数据质量异常的根本原因的系统和方法-201880100130.9
  • S·米什拉;S·R·希萨里娅;M·米里根克;N·K·那伊康达 - 维萨国际服务协会
  • 2018-12-19 - 2021-07-23 - G06F16/215
  • 实施例检测和预测数据仓库中的数据差异问题。实施例导出关于在所述数据差异之前发生的事件的有意义洞察发现,并关联所述事件以理解所述数据差异的根本原因(或由于检测到所述数据差异而生成的警示的根本原因)。实施例采取或推荐可操作措施来预防被标识为所述根本原因的所述事件的进一步发生。根据各种实施例,当受监测数据是交易数据(例如交易量、交易金额、交易处理速度等)时,内部事件(例如数据作业失败、作业延迟、作业服务器维护)或外部事件(例如季节性假期事件、自然灾害)可引起所述交易数据的下落或突增,从而导致数据质量异常(即,数据差异)。
  • 分布式分类账中基于DAG的交易处理方法和系统-201980055454.X
  • 杨宝华 - 甲骨文国际公司
  • 2019-02-01 - 2021-04-02 - G06F16/215
  • 本文描述了用于分布式分类账中基于DAG的交易处理系统和方法的系统和方法。根据实施例,可以引入分布式分类账中基于DAG的交易处理系统和方法。该模型可以帮助实现提高的吞吐量性能。借助附加的权重机制,可以基于各种业务需求来调整最终性能。这与使用线性结构的现有工作不同,并且可以实现更好的性能。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top