[发明专利]一种基于CIM模型建立电网大数据仓库的方法有效
申请号: | 201810993639.2 | 申请日: | 2018-08-29 |
公开(公告)号: | CN109492055B | 公开(公告)日: | 2019-08-06 |
发明(设计)人: | 林宝德;马文;田园;杨铮宇;黄文思;李金湖;欧阳文佳 | 申请(专利权)人: | 云南电网有限责任公司信息中心;国网信通亿力科技有限责任公司;国网信息通信产业集团有限公司;国家电网有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28 |
代理公司: | 北京锺维联合知识产权代理有限公司 11579 | 代理人: | 赵中璋 |
地址: | 650000*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 提供了一种基于CIM模型建立电网大数据仓库的方法,包括基于多个现有电网业务系统的数据库表结构、ECIM模型重新构造CIM模型;以所述重新构造的CIM模型为标准将所述多个现有电网业务系统以及所述ECIM中的数据进行格式转换并存储以建立电网大数据仓库,减少了电网大数据仓库创建过程中的人为干预,当存在多种数据库类型,仍然能够更加高效稳定地实现大数据仓库的创建,特别是基于CIM模型实现自动创建大数据仓库,并且在创建过程中应用本专利的相关度量及属性及关系度量算法使得实体合并更加准确高效,同时将对于数据的处理,将数据清洗与合并采用不同周期处理方式,避免了可能存在的大数据仓库的访问冲突。 | ||
搜索关键词: | 大数据 仓库 电网 业务系统 重新构造 创建 数据库表结构 数据库类型 访问冲突 格式转换 关系度量 人为干预 实体合并 数据清洗 周期处理 自动创建 度量 算法 存储 合并 应用 | ||
【主权项】:
1.一种基于CIM模型建立电网大数据仓库的方法,包括:基于多个现有电网业务系统的数据库表结构、ECIM模型重新构造CIM模型;以所述重新构造的CIM模型为标准将所述多个现有电网业务系统以及所述ECIM中的数据进行格式转换并存储以建立电网大数据仓库;所述基于多个现有电网业务系统的数据库表结构、ECIM模型重新构造CIM模型包括:从多个现有电网业务系统的数据库表结构中提取实体子集SUBEN1,……,SUBENi,……,SUBENn,属性子集SUBPR1,……,SUBPRi,……,SUBPRn,关联关系子集SUBRE1,……,SUBREi,……,SUBREn,所述多个电网现有业务系统分别属于不同的数据库类型,i,n为整数,且n>1,1<=i<=n;从ECIM中提取实体子集SUBENn+1、属性子集SUBPRn+1、关联关系子集SUBREn+1,所述ECIM是在标准CIM基础上扩展后得到的;将所有实体子集合并为一个实体集合SETEN,将所有的属性子集合并为一个属性集合SETPR,将所有的关联关系子集合并为一个关联关系集合SETRE;以所述实体集合SETEN、属性集合SETPR、关联关系集合SETRE为基础构建实体关系模型;将所述实体关系模型对象化以得到重新构造的CIM模型;所述将所有实体子集合并为一个实体集合SETEN,将所有的属性子集合并为一个属性集合SETPR,将所有的关联关系子集合并为一个关联关系集合SETRE包括:分别创建空的实体集合SETEN、空的属性集合SETPR、空的关联关系集合SETRE;将从ECIM中提取出的实体子集SUBENn+1中的所有元素存放在所述实体集合SETEN中,将从ECIM中提取出的属性子集SUBPRn+1中的所有元素存放在所述属性集合SETPR中,将从ECIM中提取出的关联关系子集SUBENn+1中的所有元素存放在所述关联关系集合SETRE中;对于每个SUBENi,逐一将SUBENi中的每个实体ENj合并到所述实体集合SETEN中,其中1<=j<=m,j,m为整数,且m>1;所述逐一将SUBENi中的每个实体ENj合并到所述实体集合SETEN中包括:在ENj所在现有电网业务系统i的数据字典中提取对应于ENj的描述字符串STRj;计算ENj的描述字符串STRj与实体集合中的每个实体的描述字符串之间的相关度量值;如果实体集合SETEN中不存在相关度量值大于预定相关阈值的实体,则直接将ENj存放在所述实体集合SETEN中;如果实体集合SETEN中存在相关度量值大于预定相关阈值的实体ENT1,……,ENTk,……ENTz,k,z为整数,且1<=k<=z,z>0,则将这些实体作为候选实体,并进一步计算这一个或多个候选实体中每个实体ENTk与ENj的属性及关系度量值,如果这一个或多个实体中不存在属性及关系度量值大于预定属性及关系阈值的实体,则直接将ENj存放在所述实体集合SETEN中;如果这一个或多个实体中存在属性及关系度量值大于预定属性及关系阈值的实体ENTT1,……,ENTTh,……ENTTx,h,x为整数,且1<=h<=x,x>0,则将ENj与属性及关系度量值最大的实体ENTTmax进行整合;从属性集合SETPR中提取所有包括实体ENTk的元素并存放于集合SETPRPF中,从所述集合SETPRPF中的所有元素中提取出属性项并存放于第一属性集合SETPRF中;从关联关系集合SETRE中提取所有包括实体ENTk的元素并存放于集合SETREPF中,从所述集合SETREPF中的所有元素中提取出非ENTk项的实体项并存放于第一关联关系集合SETREF中;从属性子集SUBPRi中提取所有包括实体ENj的元素并存放于集合SETPRPS中,从所述集合SETPRPS中的所有元素中提取出属性项并存放于第二属性集合SETPRS中;从关联关系子集SUBREi中提取所有包括实体ENj的元素并存放于集合SETREPS中,从所述集合SETREPS中的所有元素中提取出非ENj项的实体项并存放于第二关联关系集合SETRES中;计算属性及关系度量值
,其中∩为交集运算符号,∪为并集运算符号,||为计算集合中元素数量的运算符号,a、b为权重系数,且a>1,b<1,c为比例系数,当|SETPRF|+|SETPRS|>|SETREF|+|SETRES|时取
否则取![]()
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云南电网有限责任公司信息中心;国网信通亿力科技有限责任公司;国网信息通信产业集团有限公司;国家电网有限公司,未经云南电网有限责任公司信息中心;国网信通亿力科技有限责任公司;国网信息通信产业集团有限公司;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810993639.2/,转载请声明来源钻瓜专利网。