[发明专利]一种物联网网关数据纠错方法有效
| 申请号: | 202210717724.2 | 申请日: | 2022-06-23 |
| 公开(公告)号: | CN114816825B | 公开(公告)日: | 2022-09-09 |
| 发明(设计)人: | 蔡黔江;严可达;许大为;侯金彪;占浩;刘强;涂杰 | 申请(专利权)人: | 光谷技术有限公司 |
| 主分类号: | G06F11/07 | 分类号: | G06F11/07;G06K9/62 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 430000 湖北省武汉市东湖新技术开发*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 联网 网关 数据 纠错 方法 | ||
本发明涉及一种物联网网关数据纠错方法,属于大数据分析技术领域,该方法步骤包括:获取网关样本数据;将样本数据按照最优长度数值划分为多个等长度的最优时间序列单元;计算出每个最优时间序列单元的自相关性和每个最优时间序列单元的正常程度;根据每个最优时间序列单元的自相关性和正常程度,确定每个最优时间序列单元的关注度;利用每个最优时间序列单元的关注度训练单类支持向量机算法分类器,利用已训练完成的分类器对物联网网关数据进行纠错。本发明根据每个最优时间序列单元的关注度控制训练过程中不同最优时间序列单元对单类支持向量机算法分类器的影响,提高分类器的准确性。
技术领域
本发明属于大数据分析技术领域,具体涉及一种物联网网关数据纠错方法。
背景技术
随着物联网在实际生活与生产中应用的扩展,其以数据为中心的特点日益凸显。物联网能否得以广泛应用在一定程度上取决于网关数据中有用信息的提取,即对网关数据的挖掘,而数据质量直接决定有用信息的提取效率,决定最终物联网决策的正确性,从而影响应用场景的功能实现与用户体验。为了能够高效的提取网关数据中的有用信息,需要提高数据的质量。
在物联网场景中,由于传感器性能不稳定、数据传输网络故障、人为或自然环境带来的干扰和破坏等因素,都可能导致异常数据的产生,使得数据质量急剧下降,因此识别物联网网关数据中的异常数据尤为重要。
单类支持向量机算法是一种检测异常数据的算法,只需要正常数据就可建立数据检测分类器的单分类算法。但是在训练分类器时,样本数据中可能属于异常数据的样本会影响分类器学习正常数据的特征,导致分类器检测异常数据的准确性较低。
发明内容
本发明提供一种物联网网关数据纠错方法,旨在解决目前在训练单类支持向量机算法分类器时,样本数据中可能属于
异常数据的样本会影响分类器学习正常数据的特征,导致分类器检测异常数据的准确性较低的问题。
本发明的一种物联网网关数据纠错方法采用如下技术方案:该方法包括:
获取网关单一类型样本数据;
将所述样本数据按照预设时间长度范围内的任一长度数值进行划分得到多个等长度的时间序列单元,由多个等长度的时间序列单元组成该长度数值所对应的时间序列数据;
获取预设时间长度范围内每个长度数值所对应的时间序列数据,将所述每个长度数值所对应的时间序列数据进行拟合并根据拟合结果确定最优长度数值,根据所述最优长度数值将所述样本数据划分为多个等长度的最优时间序列单元;
计算每个所述最优时间序列单元的自相关性;
将获得的所有所述最优时间序列单元转换到多维空间内,该多维空间的维度等于所述最优长度数值;
以每个所述最优时间序列单元为中心以根据所述样本数据确定的数值为半径,确定每个所述最优时间序列单元在所述多维空间内的相邻数据集;
根据每个所述最优时间序列单元和每个所述最优时间序列单元对应的所述相邻数据集,确定每个所述最优时间序列单元的正常程度;
根据每个所述最优时间序列单元的自相关性和每个所述最优时间序列单元的正常程度,确定每个所述最优时间序列单元的关注度;
利用每个所述最优时间序列单元的关注度训练单类支持向量机算法分类器,利用已训练完成的所述分类器对物联网网关数据进行纠错。
进一步地,所述将所述每个长度数值所对应的时间序列数据进行拟合并根据拟合结果确定最优长度数值,包括:
对所述每个长度数值所对应的时间序列数据进行拟合得到每个长度数值所对应的拟合结果;
当任一长度数值所对应的拟合结果大于由该长度数值确定的阈值时将该长度数值所对应的拟合结果进行标记得到标记后拟合结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于光谷技术有限公司,未经光谷技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210717724.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:地形面积计量方法及电动车辆
- 下一篇:超级电容组串主动均衡控制方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





