[发明专利]基于Apriori算法的继保装置缺陷数据关联性分析方法及系统在审
申请号: | 202011100986.1 | 申请日: | 2020-10-15 |
公开(公告)号: | CN112308118A | 公开(公告)日: | 2021-02-02 |
发明(设计)人: | 刘一民;杨心平;郑少明;杨慧敏;杜鹃;王宁 | 申请(专利权)人: | 国家电网公司华北分部 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N5/02 |
代理公司: | 北京天盾知识产权代理有限公司 11421 | 代理人: | 张彩珍 |
地址: | 100053 北京市西城区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 apriori 算法 装置 缺陷 数据 关联性 分析 方法 系统 | ||
1.基于Apriori算法的继保装置缺陷数据关联性分析方法,其特征在于,包括:
S10:获取继保装置的缺陷统计信息,从缺陷统计信息的属性集中选择适用于缺陷分析的属性;
S20:将选择的属性中所对应的文本信息转化为数字标签文件,作为数据样本,然后将数据样本按照厂家进行划分;
S30:利用Apriori算法从划分好的数据样本中筛选出项目的所有频繁项集;
S40:从所筛选的每个频繁项集中挖掘关联规则,并根据关联规则分析继保装置的缺陷。
2.根据权利要求1所述的基于Apriori算法的继保装置缺陷数据关联性分析方法,其特征在于,所述步骤S10包括,对设备缺陷统计信息的属性集进行筛选,标注出标签属性和有效属性,其中,所述标签属性包括仅作为装置身份识别和厂站地理位置信息标识的属性,所述有效属性包括对缺陷薄弱点分析有效用的属性。
3.根据权利要求1所述的基于Apriori算法的继保装置缺陷数据关联性分析方法,其特征在于,所述步骤S10中的缺陷统计信息包括继保装置的设备信息、缺陷的评价信息和缺陷处理的日志文本信息。
4.根据权利要求1所述的基于Apriori算法的继保装置缺陷数据关联性分析方法,其特征在于,所述步骤S30包括,利用Apriori算法的先验原理,用逐层搜索的迭代方法获取满足支持度要求的频繁项集。
5.根据权利要求1或4所述的基于Apriori算法的继保装置缺陷数据关联性分析方法,其特征在于,所述步骤S30的具体方法步骤包括,
S31:根据缺陷数据总量预设一个最小支持度i(0i1);
S32:在第一次迭代中,扫描所有的事务,对每个项的出现次数计数,根据如下公式求得各个支持度:
式中,A表示每个有效属性的具体取值,D表示所分析的样本总量;
S33:将得到的各个支持度与最小支持度i进行比较,保留不小于最小支持度i的项,确定频繁1项集的集合L1;
S34;由集合L1产生候选2项集集合C2,集合C2由集合L1中每个频繁项集两两分配组成,扫描D样本中的事务,计算C2中每个候选集的支持度,保留不小于最小支持度i的集合组合,确定频繁2项集的集合L2;
S35:由集合L2产生C3时,使用Apriori性质剪枝,然后扫描D中事务,计算C3中每个候选集的支持度,保留不小于最小支持度i的集合组合,确定频繁3项集L3;
S36:按照步骤S31至S35,逐层搜索迭代,筛选出所有频繁项集,直至不能找到频繁k项集。
6.根据权利要求1所述的基于Apriori算法的继保装置缺陷数据关联性分析方法,其特征在于,所述步骤S40包括,根据筛选出的所有频繁项集设定最小置信度,每个频繁项集生成多个关联规则,去除频繁项集中可信度小于置信度的关联规则,得到满足最小置信度的关联规则。
7.根据权利要求6所述的基于Apriori算法的继保装置缺陷数据关联性分析方法,其特征在于,所述步骤S40的具体方法步骤包括,
S41:按照筛选出的频繁项集数据总量预设一个最小置信度u(0u1);
S42:根据如下公式,计算L1、L2......Lk每个频繁项集所包括的项的置信度:
式中,A、B表示某个频繁项集的元素或元素集合,A=B表示某个元素或某个元素集合可能会推导出另一个元素;
S43:将上述计算出的多个关联规则的置信度与预设的最小置信度u进行比较,保留有影响作用且满足最小置信度要求的关联规则,并利用保留的关联规则确认继保装置的缺陷和薄弱环节。
8.基于Apriori算法的继保装置缺陷数据关联性分析系统,其特征在于,包括,
信息获取模块,用于获取继保装置的缺陷统计信息,从缺陷统计信息的属性集中选择适用于缺陷分析的属性;
信息转化模块,将选择的属性中所对应的文本信息转化为数字标签文件,作为数据样本,然后将数据样本按照厂家进行划分;
信息处理模块,用于利用Apriori算法从划分好的数据样本中筛选出项目的所有频繁项集;
信息分析模块,用于从所筛选的每个频繁项集中挖掘关联规则,并根据关联规则分析继保装置的缺陷。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家电网公司华北分部,未经国家电网公司华北分部许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011100986.1/1.html,转载请声明来源钻瓜专利网。