[发明专利]事件型变量关联性计算方法在审
申请号: | 201711379860.0 | 申请日: | 2017-12-19 |
公开(公告)号: | CN108197169A | 公开(公告)日: | 2018-06-22 |
发明(设计)人: | 王智敏;王广辉;李伟阳;郑厚清;贾德香;柳占杰;于灏;陈光;陈睿欣;王玓;刘素蔚;施永益;钱仲文;黄建平;陈浩;张建松;沈思琪;董知周;苏安龙;周小明;张佳鑫;周兵兵;寸馨;黄柏富;晏梦璇;许方园;施明泰;李浩松;许中平;李金;康泰峰 | 申请(专利权)人: | 国网能源研究院有限公司;国网浙江省电力有限公司;国网辽宁省电力有限公司;北京国网信通埃森哲信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京八月瓜知识产权代理有限公司 11543 | 代理人: | 马东瑞 |
地址: | 102200 北京市昌平*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 样本集合 自变量 关联性计算 因变量 关联性 集合 计算事件 随机抽取 样本分类 准确度 事件性 数据项 配对 向量 样本 重复 转换 平衡 | ||
一种事件型变量关联性计算方法,将事件型变量的逻辑自变量按数值不同划分为两个集合a和b,每个集合中的自变量数值相同;确定a和b中元素个数较少的集合b,以及b中元素个数nb,从a中随机抽取nb个元素,与b中所有元素共同组成自变量样本集合xi,将自变量样本集合对应的因变量数值组成一个因变量样本集合yi,重复本步骤k次,生成k个自变量样本集合,和k个因变量样本集合;对每个自变量样本集合,计算其与对应的因变量样本集合的关联性,生成k维关联性向量,再计算事件型变量的关联性。该方法采用配对性样本分类器,将两个事件性数据项间的关联性计算转换为多个平衡样本的关联性计算,最终提升事件型变量关联性计算准确度。
技术领域
本发明涉及数据挖掘领域,具体地说,涉及一种事件型变量关联性计算方法。
背景技术
在数据挖掘和统计领域,数据分析决策者经常需要评价两个数据项的关联性,这就往往需要对事件型变量,进行关联性计算,然而,事件型变量的不均匀对其关联性计算会带来的偏差影响,会给相应的数据挖掘和统计,带来结果的偏差,从而影响最终的数据挖掘和统计结果,导致数据分析决策者不能精确的评价两个数据项的关联性。
考虑到现有技术的上述特点与存在的不足,亟需一种能够提升事件型变量关联性计算准确度的方法。
发明内容
为解决上述问题,本发明提供了一种事件型变量关联性计算方法,在一个示例性实施例中,本发明提供的事件型变量关联性计算方法,包括:
步骤1,将待计算关联性的事件型变量的逻辑自变量按数值不同划分为两个集合a和b,每个集合中的逻辑自变量数值相同;
步骤2,确定a和b中元素个数较少的集合b,以及b中元素个数nb,从a中以平均分布为基础,随机抽取nb个元素,与b集合中所有元素共同组成逻辑自变量样本集合xi,将自变量样本集合对应的因变量数值组成一个因变量样本集合yi,重复本步骤k次,生成k个逻辑自变量样本集合,和k个因变量样本集合;
步骤3,对步骤2中得到的每个自变量样本集合,计算其与对应的因变量样本集合的关联性,生成k维关联性向量;
步骤4,根据步骤3中的k维关联性向量,计算事件型变量的关联性。
在一些示例中,所述步骤4中,事件型变量关联性,通过如下公式计算:
其中,Corrfinal表示事件型变量的最终关联性数值。Corri表示k维关联性向量中的第i个元素。
在一些示例中,所述k通过如下公式计算:
在一些示例中,所述步骤3中,样本集合的关联性计算方法,包括:
皮尔逊积矩相关系数模型、Kendall相关系数模型或Spearman相关系数模型。
本发明采用的事件型变量关联性计算方法,该方法采用配对性样本分类器,将两个事件性数据项间的关联性计算转换为多个平衡样本的关联性计算,最终提升事件型变量关联性计算准确度,辅助数据分析决策者精确评价两个数据项之间的关联性。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例共同用于解释本发明,并不构成对本发明的限制。在附图中:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网能源研究院有限公司;国网浙江省电力有限公司;国网辽宁省电力有限公司;北京国网信通埃森哲信息技术有限公司,未经国网能源研究院有限公司;国网浙江省电力有限公司;国网辽宁省电力有限公司;北京国网信通埃森哲信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711379860.0/2.html,转载请声明来源钻瓜专利网。