[发明专利]一种面向大型粮堆异常信息的聚类分析方法和装置在审
申请号: | 202210543458.6 | 申请日: | 2022-05-19 |
公开(公告)号: | CN114997612A | 公开(公告)日: | 2022-09-02 |
发明(设计)人: | 王百一;蔡巾兰;马福航;成江昊;张艳晴;袁浩;马启航;马振轩;刘新华 | 申请(专利权)人: | 宿迁聚谷智能科技有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q10/08;G06Q50/02;G06K9/62 |
代理公司: | 徐州先卓知识产权代理事务所(普通合伙) 32555 | 代理人: | 付艳艳 |
地址: | 223800 江苏省宿迁市宿*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 大型 异常 信息 聚类分析 方法 装置 | ||
1.一种面向大型粮堆异常信息的聚类分析方法,其特征在于:包括以下步骤
步骤一、从粮堆管理系统中读取相关设备记录的可能存在波动的数据;将数据作为样本数据输入;进行箱型图建模处理;
步骤二、剔除无异常数据;进行数据读取,将异常数据输入;
步骤三、设置聚类算法超参数;随机抽取样本当作不同类别的中心点;
步骤四、计算其余点到中心点的距离,根据最近的距离选择族群;计算族群平均值,并将其与旧点中心比较;若族群平均值与旧点中心不同,则继续执行步骤四;若族群平均值与旧点中心相同,则结束聚类;
步骤五、将数据分为风险性异常数据及非风险性异常数据,并将前者输入;建立评价指标;对评价指标进行降维处理,降低指标之间的相关性;
步骤六、计算处理后的评价指标的信息量;将信息量进行归一化处理;计算熵和权;计算加权得分,得到评价指标贡献率;建立数据评分模型,完成对数据异常程度的合理打分。
2.根据权利要求1所述的一种面向大型粮堆异常信息的聚类分析方法,其特征在于:所述步骤一中,在进行箱型图建模之前,先将设备记录的数据进行预处理,将其作为样本数据输入;
箱型图算法模型的建立:
计算下分位数、中分位数和上分位数,其可由下述公式确定:
其中,n表示检测数据的项数,Q1,Q2,Q3分别表示下分位数、中分位数和上分位数,进而,确定异常值;
四分位数全距为:
IQR=Q3-Q1
限制线位置为:
Q1-1.51QR~~Q3+1.51QR
并借此规定限制线以外的数据全部为异常数据。
3.根据权利要求1所述的一种面向大型粮堆异常信息的聚类分析方法,其特征在于:所述步骤二中,对利用数据读取算法对异常数据进行读取,并将其作为系统聚类算法的输入;
聚类分析算法模型的建立包括:
首先,设定一个最小化平方误差:
其中
其中,Ci表示检测数据簇,μi表示检测数据簇Ci的均值向量,或者说是质心,x是样本点,k表示样本点个数;
||x-μi||2
代表每个样本点到均值点的距离;
使用闵可夫斯基距离
作为距离的度量,其中,p表示阶数,xi和xj表示两个样本点;
取p==2,将闵可夫斯基距离设为欧氏距离;
完成上述工作后,从样本中随机选取k个样本点作为初始的均值向量
{μ1,μ2,…μk}
其中,k表示聚类簇数。
4.根据权利要求3所述的一种面向大型粮堆异常信息的聚类分析方法,其特征在于:所述步骤五中,将数据分为风险性异常数据及非风险性异常数据包括以下条件:
(1)令
(2)对所有样本点计算其到k个均值向量之间的距离,取其中距离最短的距离对应的均值向量的标记作为该点的簇标记,然后将该点加入相应的簇Ci
(3)对每一个簇计算他们新的均值向量
如果相比之前的向量有变化,则更新,将其作为新的均值向量,如果没有变化就不变;
完成上述处理过程,得到风险性异常数据和非风险性异常数据的聚类分析模型,完成对异常数据的分类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宿迁聚谷智能科技有限公司,未经宿迁聚谷智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210543458.6/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置