[发明专利]一种基于离群数据挖掘的液态危化品挥发浓度异常发现方法在审
申请号: | 202110273839.2 | 申请日: | 2021-03-15 |
公开(公告)号: | CN112949735A | 公开(公告)日: | 2021-06-11 |
发明(设计)人: | 薛善良;彭振峰;韦青燕;肖雪 | 申请(专利权)人: | 南京航空航天大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 南京天华专利代理有限责任公司 32218 | 代理人: | 瞿网兰 |
地址: | 210016 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 离群 数据 挖掘 液态 危化品 挥发 浓度 异常 发现 方法 | ||
一种基于离群数据挖掘的液态危化品挥发浓度异常发现方法,其特征是首先是引入去一划分信息熵确定离群属性的权重;使用基于密度的聚类算法对传感器所采集的原始数据集进行筛选得到初步离群数据集,提高算法的运行效率;然后,用
技术领域
本发明涉及的是一种离群数据挖掘方法,尤其是一种基于局部异常因子改进的液态危化品挥发浓度异常发现方法,将离群数据挖掘技术应用于危化品挥发气体浓度估计的数据处理分析,及时发现异常的浓度指标,以提高生产安全风险识别能力,具体的说是一种基于离群数据挖掘的液态危化品挥发浓度异常发现方法。
背景技术
液态危险化学品的存储、运输问题一直事关我国人民生命财产安全。不同的液态危化品虽然呈现不同的性状。易挥发性是大多数液态危化品的共性,如汽油,LNG,液氨,醇类,苯类都是常见的易挥发危化品。实践中,石化企业在存储、运输的过程中,常常需要频繁监测多项安全指标以保证在生产过程中没有出现意外泄漏。液态危化品挥发的气体监测是判断意外泄漏的一项重要依据。在开放作业的场合,由于单个气体传感器部署的局限性,时常会出现一定的误差,甚至是误报。因此也有企业使用大量传感器组成阵列进行检测,大量的传感器可以减少误报,提高精确度,但大量的传感器原始数据在运用前,则需要进行预处理。所以解决如何高效地对数据进行预处理,准确识别出现偶发性错误的个别传感器,挖掘出离群的传感器数据等问题就具备较高的意义和实现价值。
传统的离群数据挖掘算法在液态危化品气体浓度传感器监测数据常有不适性和运行时间过长的问题。气体浓度传感器采集的数据是依据于实际条件决定的,表现出强客观性,无预见性。但其数据离群的行为原因可能有多重。而安全问题往往具有较高的时效性要求,离群数据挖掘算法需要有快速的执行效率,且能准确定位离群数据点,为后续分析提供及时准确的数据。本发明将数据挖掘技术应用到气体浓度数据离群检测中,提出一种基于局部异常因子算法改进的液态危化品挥发浓度异常发现方法,辅助后续算法进行更有针对性地大量传感器数据批量处理。
发明内容
本发明的目的是针对气体浓度传感器阵列采集批量数据的情形,应对现有离群数据挖掘算法在大量传感器监测数据的不适性和运行时间过长的问题,发明一种基于离群数据挖掘的液态危化品挥发浓度异常发现方法,利用改进的局部异常因子算法传感器数据进行离群分析,准确高效地挖掘出离群的传感器数据点。
本发明的技术方案是:
一种基于离群数据挖掘的液态危化品挥发浓度异常发现方法,利用液态危化品气体浓度传感器监测数据进行离群挖掘,可以提升液态危化品挥发气体浓度监测数据处理的效率。其特征是,首先,引入去一划分信息熵确定离群属性的权重;然后,使用OPTICS聚类算法对气体浓度传感器采集到的原始数据集进行筛选得到初步离群数据集,提高算法的运行效率;用P权值代替LOF算法中的可达距离;最后,利用新定义的基于P权值的局部离群因子LOFBP(Local Outliers Factor based on P-weight)计算初步离群数据集中对象的离群程度,在保留算法的检测精度的同时提高执行效率。
对于现有离群数据挖掘算法检测出离群传感器数据运行时间过高的问题,LOFBP算法采用OPTICS作为预处理,并重新定义局部离群算法中离群因子的方法。为了降低离群挖掘的时间复杂度,在不影响最终分析结果的前提下,缩小数据集,提高挖掘效率。为了解决局部离群因子算法的不足,LOFBP算法在距离度量时引入去一划分信息熵,用P权值代替传统LOF算法中的可达距离并重新定义局部离群因子,可以极大提高检测精确度。
具体包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110273839.2/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置