[发明专利]一种基于小波分析和半监督学习的车联网油耗数据质量评估方法有效

专利信息
申请号: 201710447844.4 申请日: 2017-06-14
公开(公告)号: CN107169532B 公开(公告)日: 2020-07-03
发明(设计)人: 田大新;朱宇凯;王云鹏;李玉洲;刘超;郑坤贤;周建山;康璐;刘文豪 申请(专利权)人: 北京航空航天大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 北京永创新实专利事务所 11121 代理人: 赵文颖
地址: 100191*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于小波分析和半监督学习的车联网油耗数据质量评估方法,包括以下步骤:步骤一:对数据进行预处理;步骤二:小波分析;步骤三:随机选取样本,由人工经验初步标注类别标签;步骤四:基于支持向量机的多分类器学习;步骤五:加入无标签的数据样本XUL,利用局部搜索策略进行半监督学习,更新分类器。本发明利用了小波分解的信号特点来构建油耗数据的属性特征,具有针对性且能有效地提高分类准确性和结论的可靠性。本发明多层小波分解得到的近似成分可以作为对数据有效的压缩过滤,细节成分能用于异常状况分析,为数据质量的类别划分提供可信的依据。
搜索关键词: 一种 基于 分析 监督 学习 联网 油耗 数据 质量 评估 方法
【主权项】:
一种基于小波分析和半监督学习的车联网油耗数据质量评估方法,包括以下步骤:步骤一:对数据进行预处理;车联网背景下所获得的信息通常至少包括GPS坐标、速度、油位、时间等数据,定义:i个油位数据的时间序列为A(a1,a2,...,ai),对应的时间为ti,油位变化值序列Q={qi|qi=ai+1‑ai},同样有速度S(s1,s2,...,si);计算速度值的可信度ε、油位变化Q的均值油耗离散系数cq(标准差/均值),油耗速度相关系数Rq,s等统计参量,其中由经纬度计算得到行程区间速度Str,用于计算速度值的可信度ε,该可信度用于SVM分类模型中的权重计算:ϵ=Σi=1nsi-Σi=1nstriΣi=1nsi]]>其中:ε为无量纲的系数,si,stri分别为第i个采样点的速度和行程区间速度;步骤二:小波分析;将油位数据序列A进行k阶离散小波变换,得到k阶近似成分Ak和k个不同尺度下的细节成分D1,D2,...,Dk;阶数k和小波基的类型根据数据的采样频率、噪声类型确定,之后对分解出的各层信号计算均值、方差、模最大值,作为特征属性;步骤三:随机选取样本,由人工经验初步标注类别标签;将数据质量的类别标签定义为L={1,2,3,4},即分为4类:类别L1:质量好,准确且噪声较小;类别L2:质量较好,有部分噪声值和异常序列但能够修正过滤;类别L3:质量较差,有较多噪声和异常序列,难以用数值方法修正;类别L4:质量很差,数据缺失或者硬件故障导致的大量噪声和异常,没有修复和统计价值;步骤四:基于支持向量机的多分类器学习;基于支持向量机分类算法,构建二叉树SVM模型进行多分类任务,将步骤一、二中计算得到的统计参量作为特征属性,以带类别标签L={1,2,3,4}的l个数据样本作为训练样本XL={X1,X2,...,Xl}进行初始的SVM分类器训练;设其中单个训练样本包含i维特征属性,类别属性为y,y∈{L|L={1,2,3,4}},即X=(x1,x2,...,xi,y);wi为第i个特征的权重,权重其中β为调整系数,σ(xi)为属性xi整体分布的方差;步骤五:加入无标签的数据样本XUL,利用局部搜索策略进行半监督学习,更新分类器。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201710447844.4/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top