[发明专利]一种基于机器学习的快递站点健康度检测方法有效
申请号: | 201710586701.1 | 申请日: | 2017-07-18 |
公开(公告)号: | CN107545387B | 公开(公告)日: | 2020-12-22 |
发明(设计)人: | 李勇;董雍佳;赵志洋 | 申请(专利权)人: | 浙江百世技术有限公司 |
主分类号: | G06F30/27 | 分类号: | G06F30/27 |
代理公司: | 北京正理专利代理有限公司 11257 | 代理人: | 付生辉 |
地址: | 310053 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种基于机器学习的快递站点健康度检测方法,包括:快递站点历史运营数据采集;采用特征工程方法对运营数据进行处理,构建建模使用的特征属性集:使用各种原始运营数据构造能体现站点运营状况的特征属性集S1;从S1中选取特征子集,并以多项式曲线拟合技术,构建能够体现站点长期运营状况变化趋势的特征属性集S2;使用构建好的特征属性数据集训练模型:对特征属性集S1中的正面样例进行上采样,然后训练随机森林模型Model1;修改随机森林的Bootstrap采样方法为下采样方法,然后使用特征属性集S2训练改进后的随机森林模型Model2。本发明可根据快递站点的运营状况发现运营异常及存在异常变化趋势的站点。 | ||
搜索关键词: | 一种 基于 机器 学习 快递 站点 健康 检测 方法 | ||
【主权项】:
一种基于机器学习的快递站点健康度检测方法,其特征在于,该方法包括如下步骤:步骤1、以快递站点各种运营数据的周均值作为各运营数据的周稳定值,选取各运营数据的多周稳定值,构建能够体现快递站点整体运营状况的特征属性集S1;步骤2、从S1中选取能够体现快递站点运营异常发生前长期变化趋势的特征属性子集,并以多项式曲线拟合技术分别拟合选取出的特征属性子集中各特征属性的多周稳定值,将拟合产生的多项式系数以及选取出的特征属性子集中各特征属性的首尾周稳定值的差值进行组合,构建能够体现快递站点长期运营状况变化趋势的特征属性集S2;步骤3、以运营异常发生时间为基准来分别对齐发生运营异常的快递站点与正常运营的快递站点平稳运营时的特征属性集S1与S2,并将S1与S2分别根据快递站点发生运营异常或正常运营进行分类;步骤4、从已经对齐并分类的特征属性集S1包含的数据中,选取发生运营异常的快递站点运营异常发生前n1周的数据与正常运营的快递站点相同周数的平稳运营时的数据;对归属于正面样例的发生运营异常的快递站点的特征属性集S1进行向上采样,然后使用随机森林算法构造并训练模型Model1;从已经对齐并分类的特征属性集S2包含的数据中,选取发生运营异常的快递站点运营异常发生n2周前的n3周的数据与正常运营站点相同周数的平稳运营时的数据,使用改进的随机森林算法构造并训练模型Model2,其中,改进的随机森林算法是将构建单棵决策树的抽样方法由Bootsrap方法改进为每次从样本量大的反面样例中随机有放回地选取一定比例的样本的下采样方法;步骤5、以实时采集的待检测快递站点的各种运营数据的周均值作为各运营数据的周稳定值,选取各运营数据的多周稳定值,构建能够体现待检测快递整体运营状况的特征属性集S3,使用模型Model1根据特征属性集S3对待检测快递站点的健康度进行检测;从S3中选取能够体现待检测快递站点运营异常发生前长期变化趋势的特征属性子集,并以多项式曲线拟合技术分别拟合选取出的特征属性子集中各特征属性的多周稳定值,将拟合产生的多项式系数以及选取出的特征属性子集中各特征属性的首尾周稳定值的差值进行组合,构建能够体现待检测快递站点长期运营状况变化趋势的特征属性集S4,使用模型Model2根据特征属性集S4对快递站点的健康度进行检测。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江百世技术有限公司,未经浙江百世技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710586701.1/,转载请声明来源钻瓜专利网。
- 上一篇:一种具有可控布料和真空排泡功能的搅拌机
- 下一篇:用于混凝土制备的搅拌设备