[发明专利]一种案情知识图谱自动构建方法及系统及设备及介质在审

专利信息
申请号: 202010001253.6 申请日: 2020-01-02
公开(公告)号: CN110781254A 公开(公告)日: 2020-02-11
发明(设计)人: 翁洋;李鑫;王竹;谷松原;其他发明人请求不公开姓名 申请(专利权)人: 四川大学;成都星云律例科技有限责任公司
主分类号: G06F16/28 分类号: G06F16/28;G06Q50/18
代理公司: 51220 成都行之专利代理事务所(普通合伙) 代理人: 熊曦
地址: 610000 四川*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种案情知识图谱自动构建方法及系统及设备及介质,包括:基于专家库预先定义实体关系;采用Bert分类模型训练裁判文书结构化分类模型;采用模型原型Bert+CRF训练实体识别模型;采用模型原型基于Bert的关系抽取模型训练关系抽取模型;构建案情知识图谱;采用CRF改进实体识别基准模型的编码层得到Bert‑CRF模型,进一步提升实体识别效果F1值;融合平移嵌入的多任务联合的语义关系抽取模型Bert,提升关系抽取结果F1值。本发明设计了一个融合结构化文本和非结构化文本的案件案情知识图谱自动构建方法,并构建了大规模司法案件的案情知识图谱,为类案精准推送等提供了语义支撑。
搜索关键词: 图谱 关系抽取 实体识别 自动构建 构建 原型 非结构化文本 分类模型训练 结构化文本 系统及设备 平移 语义 分类模型 基准模型 模型训练 实体关系 司法案件 语义关系 预先定义 融合 编码层 结构化 嵌入的 专家库 推送 抽取 裁判 支撑 案件 改进 联合
【主权项】:
1.一种案情知识图谱自动构建方法,其特征在于,所述方法包括:/n步骤A:建立专家库,基于专家库预先定义实体关系,其中实体为法律案由涉及的主题,关系为实体之间的关联,预定义的实体关系用于实体识别和关系抽取以及三元组构建;/n步骤B:采用Bert分类模型训练裁判文书结构化分类模型;采用模型原型Bert+CRF训练实体识别模型;采用模型原型基于Bert的关系抽取模型训练关系抽取模型;/n步骤C:构建案情知识图谱,包括:/n步骤C1:基于训练后的裁判文书结构化分类模型分类裁判文书的内容,提取案件基本事实和基础事实;/n步骤C2:基于训练后的实体识别模型对案件基本事实进行实体识别,抽取案情基本事实中的各种实体;/n步骤C3:基于步骤C2抽取的实体和步骤C1获得的案件基本事实,使用训练后的关系抽取模型抽取实体之间的关系,得到实体关系三元组,三元组的基本形式为:实体1,实体1与实体2之间的关系,实体2;/n步骤C4:提取步骤C1得到的基础事实的实体和属性,将得到的实体和属性与步骤C3中得到的三元组进行知识融合获得完整的案情知识图谱。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学;成都星云律例科技有限责任公司,未经四川大学;成都星云律例科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202010001253.6/,转载请声明来源钻瓜专利网。

同类专利
  • 一种数据仓库的指标血缘关系图的构建方法、装置和电子设备-201910930860.8
  • 金晶;王安滨;常富洋 - 北京淇瑀信息科技有限公司
  • 2019-09-29 - 2020-02-14 - G06F16/28
  • 本发明提供了一种数据仓库的指标血缘关系图的构建方法、装置和电子设备。所述方法包括:获取来自数据库服务器或数据库服务器集群中的多个源数据表,其中,数据库服务器或数据库服务器集群为多个金融业务应用提供数据服务;根据多个金融业务应用涉及的业务主题对多个源数据表进行归并,生成以业务主题区分的多个归并数据表;为各归并数据表提供索引,记录指标数据从源数据表到归并数据表的数据对应关系,形成数据仓库;基于所述数据对应关系,构建应用于金融业务的指标血缘关系图。本发明的指标血缘关系图能够快速准确地提供报表,或者可快速访问数据库表中的特定信息,使得支持大型表和索引更容易,同时也提高了数据管理和查询性能。
  • 一种基于云模型的知识图谱表示方法-201911045361.7
  • 刘学军;周航;蒋军成;李斌;王志荣 - 南京工业大学
  • 2019-10-30 - 2020-02-14 - G06F16/28
  • 本发明提出了一种基于云模型的知识图谱表示方法,包括以下步骤:获取数据集,按比例随机分为训练集和测试集;将训练集中每一个关系划分为多个语义,得到该关系的高斯混合模型;计算每一个关系中最能表达该关系的主语义;基于云模型计算每个主语义的语言值的坐标及其确定程度。本发明提出一种基于云模型的知识图谱表示方法,目标是在关系向量存在多语义性的前提下,获取最能表达该关系向量语义的的向量值,同时引入不确定性的思想,在新的评分函数中结合确定程度,使知识图谱的表示更加准确。
  • 一种基于空间聚类订正NWP风能图谱的方法及装置-201710002216.5
  • 向婕;雍正;董芬;何江风 - 国能日新科技股份有限公司
  • 2017-01-03 - 2020-02-14 - G06F16/28
  • 本发明提供了一种基于空间聚类订正NWP风能图谱的方法级装置,方法包括对气象站和测风塔的实测数据进行分类以及处理,建立实测数据序列;计算NWP风能图谱,并对NWP网格点进行空间聚类,将风能图谱划分为不同的区域;利用建立的实测数据序列对NWP风能图谱里的每个格点的数据进行订正。本发明用实测数据对数值模拟风速做订正,提高风速的准确率;用K值空间聚类对区域进行划分,使格点风速能找到属性最接近的实测站点进行订正,提高了订正的可靠性和合理性;通过订正,提高了风资源图谱的精确度,为宏观选址提供可靠的依据。
  • 保单数据存储方法、装置及终端设备-201710475686.3
  • 李治 - 平安科技(深圳)有限公司
  • 2017-06-21 - 2020-02-14 - G06F16/28
  • 保单数据存储方法、装置及终端设备,所述方法包括:获取保单数据维度下的保单数据以及所述保单数据维度下的保单数据的生成时间;判断所述保单数据的生成时间与当前时间的差值时长是否大于或等于预设的差值时长;在所述保单数据的生成时间与当前时间的差值时长大于或等于预设的差值时长时,根据预设的维度过滤所述保单数据维度下的保单数据,并存储过滤后的所述保单数据维度下的保单数据;在所述保单数据的生成时间与当前时间的差值时长小于预设的差值时长时,存储所述保单数据。通过上述方法节省了存储空间,且提高了保单数据的调用速度。
  • 民族文化知识数据仓库的构建方法-201910866527.5
  • 覃晓;黄呈铖;元昌安;覃正优;何国对 - 南宁师范大学
  • 2019-09-12 - 2020-02-11 - G06F16/28
  • 本发明公开了民族文化知识数据仓库的构建方法,涉及数据挖掘技术领域,解决了由于民族文化数据的特色属性多,而量化的数据较少的问题,其技术方案要点是:根据需求从单位、图书馆、博物馆等数据库中提取与民族文化相关的数据,并形成数据集合;确定事实、维度和度量值,并以度量值反映出人们对知识库中某个文化知识的关注程度;结合雪花模式和事实星座模式构建以雪花、事实星座混合模式为基础的数据仓库的数据模型;在民族文化数据中选取维A、B、C、D以及聚集度量M形成4维数据立方体;利用外壳片段算法Frag‑Shells来确定立方体的物化计算策略;采用点查询来回答OLAP查询;达到帮助人们从数据的全方位了解某个文化知识的目的。
  • 一种企业关联关系构建方法及系统-201910878683.3
  • 丁凯;龙腾;陈青山 - 上海生腾数据科技有限公司
  • 2019-09-18 - 2020-02-11 - G06F16/28
  • 本申请公开了一种企业关联关系构建方法,包括如下步骤。步骤S110:根据企业工商信息中的股权数据和高管数据,采用图计算的数据结构构建反映企业的股东投资和高管任职关系、且对同一自然人进行标注的知识图谱。步骤S120:基于企业工商信息在知识图谱中扩展增加表征企业具有关联特征的一条或多条边。步骤S170:基于时效信息对知识图谱进行扩展和更新。本申请采用图数据库构建和存储知识图谱,基于企业工商信息、企业结构化信息和/或企业非结构化信息,在知识图谱中通过节点属性、边的建立与属性来表征企业的关联特征,并广泛地具有时效信息。
  • 一种多源异构数据采集方法及装置-201910927808.7
  • 王尔昕;张伟;彭军民;陈曦;麻志毅 - 浙江省北大信息技术高等研究院;浙江大胜达包装股份有限公司;杭州未名信科科技有限公司
  • 2019-09-27 - 2020-02-11 - G06F16/28
  • 本发明公开了一种多源异构数据采集方法及装置,方法包括:从工厂的自研系统数据库中全量抽取数据并存入第一数据表;获取工厂的第三方系统提供的预设类型的数据并存入第二数据表;获取工厂的MES采集的产线实时数据并进行计算,将计算结果存入第三数据表。基于上述描述可知,针对瓦楞纸包装企业的数据特点,对于不同数据源,依据其数据库类型通过设计不同的数据采集方式对数据进行采集,并存入企业的采集服务器的数据仓库,形成企业的数据资产。采用本发明采集方案进行数据采集时,不干扰生产过程,不改动原系统数据,且节省人力物力,在完全保证生产的同时,也方便了企业将要进行的数字化智能工厂建设。
  • 保险知识图谱生成方法、装置、设备及存储介质-201911067147.1
  • 田诗颖 - 泰康保险集团股份有限公司;泰康在线财产保险股份有限公司
  • 2019-11-04 - 2020-02-11 - G06F16/28
  • 本发明实施例提供一种保险知识图谱生成方法、装置、设备及存储介质,该方法包括:采集多个保险信息;根据所述多个子险种类别以及每个所述子险种类别对应的子险种属性,确定所述多个子险种类别之间的多种组合关系;将所述险种类别作为节点实体,并将所述多个子险种类别作为所述节点实体的各个子节点;根据所述节点实体以及各个子节点,生成保险知识图谱;显示所述缩略图,以使用户根据所述子险种描述信息,点击所述缩略图,用以查询所述子节点对应的所述子险种类别的保费信息以及所述子险种类别与所述子险种类别关联的其他所述子险种类别之间的所述多种组合关系。本实施例提供的方法能够直观、有效地对保险业务知识进行查询。
  • 一种文化遗产图像特征提取方法和装置以及设备-201911097856.4
  • 江朝伟;谢琪 - 长沙理工大学
  • 2019-11-12 - 2020-02-11 - G06F16/28
  • 本发明公开了一种文化遗产图像特征提取方法和装置以及设备。其中,所述方法包括:根据历史文化遗产图像数据,创建关联该历史文化遗产图像数据的文化遗产图像数据库,和根据该创建的文化遗产图像数据库,构建基于该文化遗产图像数据库的文化遗产图像的图像特征模型,以及根据该构建的图像特征模型,对待提取图像特征的文化遗产图像进行图像特征提取。通过上述方式,能够实现无需将文化遗产图像进行图像分割即能对文化遗产图像特征进行提取,简化了提取文化遗产图像特征的过程。
  • 一种案情知识图谱自动构建方法及系统及设备及介质-202010001253.6
  • 翁洋;李鑫;王竹;谷松原;其他发明人请求不公开姓名 - 四川大学;成都星云律例科技有限责任公司
  • 2020-01-02 - 2020-02-11 - G06F16/28
  • 本发明公开了一种案情知识图谱自动构建方法及系统及设备及介质,包括:基于专家库预先定义实体关系;采用Bert分类模型训练裁判文书结构化分类模型;采用模型原型Bert+CRF训练实体识别模型;采用模型原型基于Bert的关系抽取模型训练关系抽取模型;构建案情知识图谱;采用CRF改进实体识别基准模型的编码层得到Bert‑CRF模型,进一步提升实体识别效果F1值;融合平移嵌入的多任务联合的语义关系抽取模型Bert,提升关系抽取结果F1值。本发明设计了一个融合结构化文本和非结构化文本的案件案情知识图谱自动构建方法,并构建了大规模司法案件的案情知识图谱,为类案精准推送等提供了语义支撑。
  • 一种基于逆向迭代的闭环阻止角色继承算法-201910855865.9
  • 张秀丽;徐巧珥;张铭 - 浙江万里学院
  • 2019-09-10 - 2020-02-07 - G06F16/28
  • 本发明涉及一种基于逆向迭代的闭环阻止角色继承算法,包括如下步骤:设置待建父角色为r1,待建子角色为r2;设置迭代变量为i,临时变量为j,i=j=1;在继承关系数据库中查找待建父角色r1的所有已有父角色,保存于集合fi(r1);判断fi(r1)是否为空集,若是空集,则待建父角色r1和待建子角色r2之间继承关系成立;若不是空集,则执行步骤S4;S4:判断待建子角色r2是否存在于集合fi(r1)中,若待建子角色r2属于集合fi(r1)时,则导致构成i+1元角色继承闭环,算法触发角色闭环阻止,抛出异常警报。本发明能有效防止不当的角色继承对系统造成破坏事故的产生。
  • 人员共同关系的查询方法、装置、电子设备及存储介质-201910955724.4
  • 戴世稳 - 深圳云天励飞技术有限公司
  • 2019-10-09 - 2020-02-07 - G06F16/28
  • 本发明实施例提供一种人员共同关系的查询方法、装置、电子设备及存储介质,所述方法包括:获取人员关系图谱;获取待查询的起始人员节点、终止人员节点以及查询条件;在所述查询深度范围内,选取以所述起始人员节点为起点,所述终止人员节点为终点的关系路径;基于所述关系路径,得到目标关系图谱,并对所述目标关系图谱进行展示。通过在关系图谱的查询深度内,以一个目标人员节点为起点,遍历到另一个目标人员节点为终点,形成两个目标人员的关系路径,不用对两个目标分别进行遍历,降低了需要遍历的数据量,从而降低了计算量,提高了查询的效率。
  • 数据挖掘方法、装置、计算机设备及计算机可读存储介质-201911004941.1
  • 蒋诗伟;陈丹;顾玉莲 - 中国银行股份有限公司
  • 2019-10-22 - 2020-02-07 - G06F16/28
  • 本发明实施例提供了一种数据挖掘方法、装置、计算机设备及计算机可读存储介质,其中,该方法包括:将待处理数据中与目标变量相关的特征项进行分组,分为初始分组数;每次分组后,分别计算将当前分组中任意相邻两组合并的情况下,所有分组的皮尔森卡方统计量,在得到的皮尔森卡方统计量中,按照最大的皮尔森卡方统计量对应的合并方式将相邻两组合并,合并后的分组情况视为重新分组,直至分组数为预设分组数,完成数据分箱,皮尔森卡方统计量的大小表示当前分组情况下目标变量的第一分类和目标变量的第二分类之间的差异度;基于数据分箱后预设分组数的数据进行数据挖掘。该方案使得数据分箱更合理、更准确,有利于提高数据挖掘结果的精度。
  • 一种基于多维立体空间的知识图谱编辑方法-201911010167.5
  • 李栩天;赵琨;曾琪;黄志江 - 上海恒企教育培训有限公司
  • 2019-10-23 - 2020-02-07 - G06F16/28
  • 本发明公开了一种基于多维立体空间的知识图谱编辑方法,所述方法如下:知识图谱构建:用ER图生成知识概念级架构,对概念元素进行提取,生成本体、实体、实例的对应关系;知识图谱的存储:对构建的知识图谱进行存储;知识图谱的应用:存储的知识图谱进行编辑应用;本发明的有益效果是:对知识进行分层显示,并准确描述本体、实体、实例之间的关系,当其他系统基于此图谱构建知识库的时候,能够对知识的本体、实体、实例都进行展示,让用户更全面的获取该知识点的相关信息;通过增设的扩展模块,有助于分别对本体、实体、实例的属性进行扩展,减少了数据的冗余。
  • 数据多维度自由剖析的查询方法及装置-201511032274.X
  • 洪超 - 北京国双科技有限公司
  • 2015-12-31 - 2020-02-07 - G06F16/28
  • 本申请公开了一种数据多维度自由剖析的查询方法及装置。该方法包括:分别获取与多个维度中每个维度相关联的数据表,得到关联数据表集合,其中,多个维度为需要进行剖析的维度;确定关联数据表集合中的指标表和非指标表,其中,指标表为关联数据表集合中包含待查询指标的表,非指标表为关联数据表集合中不包含待查询指标的表;根据预设过滤条件对非指标表进行过滤处理;将指标表和过滤后的非指标表进行连接,得到数据子表;以及在数据子表中查询待查询指标和剖析维度,其中,剖析维度是指根据多个维度对数据子表进行维度剖析。通过本申请,解决了相关技术中数据多维度自由剖析的查询效率较低的问题。
  • 基于设备功能的数据建模方法及装置-201610091335.8
  • 王海龙;倪茂昌;张宇;王雅哲 - 中国科学院信息工程研究所
  • 2016-02-18 - 2020-02-07 - G06F16/28
  • 本发明公开了一种基于设备功能的数据建模方法及装置,所述方法包括:按功能将物联网中的设备划分为不同的功能集合;划分每个功能集合中的主设备和关联设备,按主设备与关联设备的关联关系保存主设备的属性信息、关联设备的属性信息和关联设备采集的数据,并分别设置预定长度的连续编码;根据预定长度的连续编码,并按连续编码与主设备的属性信息、关联设备的属性信息和关联设备采集的数据的对应关系生成数据模型。本发明根据功能对设备进行划分,将主设备与关联设备进行关联存储,不仅能表示物联网中的实体与实体之间关系,且层次清晰具有可扩展性;同时通过为每个属性设定预定长度的连续编码,既便于生成数据模型,也便于查询和修改。
  • 物化视图选择和优化方法及装置-201710801784.1
  • 谭杰;白熹微;黄学文;刘承宝;李亚宁 - 中国科学院自动化研究所;大连理工大学
  • 2017-09-07 - 2020-02-07 - G06F16/28
  • 本发明涉及计算机数据处理领域,提出了一种物化视图的选择和优化方法,旨在解决海量数据环境下物化视图的选择、优化和更新问题。该方法包括:获取数据库的信息,根据信息从数据库中获得的带有聚集函数的分组数据,并生成分组数据集合;分解分组数据的非分布式聚集函数,生成分组数据的分组数据元,得到分组数据元集合;将具有相同的数据维度、聚集操作表达式的分组数据元确定为同一分组数据族;建立每个分组数据族所对应的统计二叉树模型,由此建立面向物化视图优化的最小线性规划模型,得到优化的物化视图集合,基于物化视图集合,重构分组数据,依据与物化视图相关的事实表的变化,更新物化视图。该方法能够在海量数据的统计分析中快速响应。
  • 外键到主键的基于规则的联结-201580034946.2
  • C·佩特克勒斯克;M·杜米特鲁;V·帕拉斯基夫;A·耐茨;P·J·桑德斯 - 微软技术许可有限责任公司
  • 2015-06-24 - 2020-02-07 - G06F16/28
  • 将数据库系统中的子表链接到父表。对于给定父表行,与该特定行相关联的表达被标识出。该表达可以是语义表达,该语义表达包括不同于或不仅仅只是等于表达或包含表达的某物。该表达还可取父表的除该父表的主键以外的字段作为输入。对于子表的多个行(且可能是所有行)中的每一者,该表达是对照子表的对应行的外键来评估的。如果外键匹配表达,则关联在外键和父表的特定行之间被创建并或许被保存。这些表达可不同,甚至连父表中的单个行的粒度也一样,由此允许或许定制的每行表达。
  • 数据处理方法及装置、存储介质和处理器-201810813644.0
  • 张雄 - 北京国双科技有限公司
  • 2018-07-23 - 2020-02-04 - G06F16/28
  • 本发明公开了一种数据处理方法及装置、存储介质和处理器。其中,该方法包括:确定内存的目标对象模型中的属性与数据库表中的列之间的对应关系;将上述数据库表中的数据读取到上述内存的内存数据表中;依据上述对应关系将上述内存数据表转换为上述目标对象模型。本发明解决了现有技术中的数据处理方法,需要建立内存与数据库之间的长连接,资源消耗较高,且无法通用导致实用性较低的技术问题。
  • 一种信息处理方法及装置-201910977321.X
  • 代申;袁灿;于政 - 北京明略软件系统有限公司
  • 2019-10-15 - 2020-02-04 - G06F16/28
  • 本申请提供一种信息处理方法及装置,所述方法包括:根据电网系统的业务数据确定每个实体的属性信息以及实体间的关系信息;确定每个关系信息对应的方向信息;根据每个实体的属性信息、实体间的关系信息以及每个关系信息对应的方向信息,生成电网系统的知识图谱;其中,属性信息包括实体类型和实体身份标识号ID;实体间的关系信息包括所有存在关联关系的实体ID;知识图谱包括多个实体,每个实体对应电网系统中的一个电力设备,每个实体与其它一个或者多个实体之间存在关联关系。上述技术方案可以通过知识图谱更准确地表征电网系统的拓扑结构,从而可以更有效进行电力设备管理,减少重复性劳动,提高电网调度效率。
  • 基于连接通路的交互方法、装置、存储介质及电子装置-201910984687.X
  • 赵丹华;王纵虎;陈泽;苏圣男 - 北京网众共创科技有限公司
  • 2019-10-16 - 2020-02-04 - G06F16/28
  • 本发明提供了一种基于连接通路的交互方法、装置、存储介质及电子装置,包括:在预先构建的知识图谱中确定出与第一对象相对应的第一节点;以第一节点为开始节点,第二节点为终止节点,在知识图谱中确定第一节点与第二节点之间的至少两条连接通路,其中,第二节点对应于第二对象,第一对象和第二对象满足目标关联关系;将至少两条连接通路中包含的节点数最少的连接通路确定为目标连接通路;将目标连接通路通知给第二对象,以指示第二对象基于目标连接通路与第一对象进行交互。通过本发明,解决了现有技术中的信息修复方法效率低的问题,进而达到了提高信息修复效率的效果。
  • 基于知识图谱理念和技术的工程图谱数据信息管理方法-201911001087.3
  • 韩爱民;黄凯捷;马超;何向勇 - 上海玟祎信息科技有限公司;武汉星珞科技有限公司
  • 2019-10-21 - 2020-01-31 - G06F16/28
  • 本发明公开了基于知识图谱理念和技术的工程图谱数据信息管理方法,数据仓库的工程对象数据库选用Neo4j图数据库作为数据库软件平台,Neo4j与传统的关系型数据库不同,Neo4j主要通过节点和关系来存储数据,每个节点可以标注Label,类似于表,可以分别建立索引。与关系型数据库不同,节点之间的关系(类比为表之间的关系)同样作为物理对象存储,从而避免多表查询的笛卡尔积问题,极大提高关联检索的性能。且本专利同时对基于以知识图谱理念和ISO15926标准,采用Neo4j技术的工程对象数据仓库设计方法中的将对象作为节点并通过节点和节点之间的关系来分类、关联、存储数据的方法进行保护。
  • 基于无监督学习的用户分类方法、装置、设备及存储介质-201911001169.8
  • 黄文炳;徐挺洋;荣钰;黄俊洲 - 腾讯科技(深圳)有限公司
  • 2019-10-21 - 2020-01-31 - G06F16/28
  • 本发明涉及基于无监督学习的用户分类方法、装置、计算机设备及存储介质,属于用户分类技术领域。该方法包括:获取待分类用户的第一原始特征;将第一原始特征输入到无监督学习的拓扑关系确定模型中;拓扑关系确定模型对应有目标损失函数;目标损失函数根据第一特征表达式和第二特征表达式的相关度构建;第一特征表达式为第一原始特征对应的表达式,第二特征表达式为拓扑关系特征对应的表达式;根据拓扑关系确定模型的输出,得到待分类用户的目标拓扑关系特征;根据目标拓扑关系特征,确定待分类用户对应的用户类别。上述技术方案,在不需要人工提供用户标签的情况下,就能实现对网络用户的准确分类,能有效降低网络用户分类的成本。
  • 一种基于决策树的公积金用户数据细化分析系统及方法-201911022440.6
  • 李子龙;鲍蓉;潘晓博 - 徐州工程学院
  • 2019-10-25 - 2020-01-31 - G06F16/28
  • 本发明公开了一种基于决策树的公积金用户数据细化分析系统及方法,包括:数据采集模块,用于采集多源公积金用户数据,识别出实体、实体属性以及实体之间的关系,并消除多源数据中存在的冲突;数据存储模块,用于将转换的关系型数据保存到关系数据库中;数据预处理模块,用于将原始的关系型数据转换为用户细化分析中决策树所使用的特征数据;数据分析模块,使用决策树对用户特征数据进行细化分析,最后将分析结果以图表形式展示给用户。本发明通过对原始关系模型数据进行预处理,从中提取出用于决策树细化分析的特征数据,并在其基础上设计出基于新的决策树的公积金用户数据细化分析方法,从而能及时准确地为公积金管理部门提供有力的决策支持。
  • 一种数据仓库数据异常的预检测方法和设备-201510742748.3
  • 方鹏飞 - 阿里巴巴集团控股有限公司
  • 2015-11-04 - 2020-01-31 - G06F16/28
  • 本申请公开了一种数据仓库数据异常的预检测方法和设备,通过应用本申请实施例所提出的技术方案,服务器将当前的在线数据同步到数据仓库中作为待检测的基础数据,与之前的离线数据进行对比,并在基础数据出现变化的情况下,按照之前的处理规则生成模拟应用数据,进一步通过与之前的应用数据进行对比,来确定数据是否异常,从而,服务器可以对数据异常进行预判,而待检测的基础数据和模拟应用数据均为预生成的数据,可以有效的避免由于发现数据异常的滞后性而引起的不可挽回的损失,同时还节省了对异常数据进行修复时而产生的不必要的成本。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top