[发明专利]基于半监督核费舍尔判别分析物流企业客户分类方法在审
申请号: | 201910583612.0 | 申请日: | 2019-06-30 |
公开(公告)号: | CN110348502A | 公开(公告)日: | 2019-10-18 |
发明(设计)人: | 陶新民;常瑞;任超;郭文杰;李青;刘锐;陶思睿 | 申请(专利权)人: | 东北林业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q30/02 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150040 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 物流企业 客户分类 矩阵 目标函数 判别分析 投影矩阵 投影坐标 半监督 归一化 客户 标准化处理 最近邻算法 分类问题 矩阵构建 矩阵计算 客户类别 客户信息 数据样本 样本数据 正则化项 最小化 分类 求解 整合 样本 集合 申请 应用 | ||
基于半监督核费舍尔判别分析物流企业客户分类方法,其特征在于:该方法包括以下步骤:(1)确定物流企业常用的客户分类指标及分类情况;(2)根据(1)确定的客户分类指标进行物流企业客户信息的收集;(3)对(2)的数据样本集合标准化处理;(4)对(3)获取的归一化后客户样本数据矩阵构建一致性假设矩阵,并计算局部类间和类内拉普拉斯矩阵;(5)利用步骤(4)中获取的一致性假设矩阵计算正则化项拉普拉斯矩阵并整合到Fisher判别分析目标函数中,通过求解最小化目标函数获得最优投影矩阵;(6)计算(2)的归一化后客户样本在投影矩阵上的投影坐标,(7)利用最近邻算法对投影坐标分类确定客户类别。本发明申请应用于物流企业客户的分类问题。
技术领域:
本发明申请涉及一种物流企业客户管理领域,尤其涉及一种基于半监督核费舍尔判别分析物流企业客户分类方法。
背景技术:
近年来,随着互联网、物联网、云计算、三网融合等IT与通信技术的迅猛发展,大数据开始蔓延到社会的各行各业。大数据时代的到来使国内物流企业的运行环境发生了较大的变化,目前国内物流正面对一个全面开放的、国际国内全方位充分竞争的市场环境。在充满竞争的商业时代,物流企业必须通过占有更多优势资源,拥有大量有效客户,提供最佳客户服务,提升原有客户体验,进而增强客户的忠诚度和满意度。因此,面对海量高维的客户信息,企业如何通过正确有效的方法对客户进行分类和管理,对于企业了解客户需求,与客户建立长期良好关系,避免客户流失,提高企业核心竞争能力均具有十分重要的现实意义。
费舍尔判别分析(Fisher Discriminant Analysis,FDA)作为一个有监督学习方法,因能利用已有的类别信息通过最大化类间散度和最小化类内散度的方式优化降维子空间,使得降维后的特征有利于类别间的区分进而广泛应用于各种分类领域。但FDA在处理非线性数据时存在一定局限性,为解决这个问题,学者提出了基于核的KFDA(Kernel FisherDiscriminant Analysis)非线性算法,该算法是一种非线性数据维数约简方法,它通过核函数将原空间数据映射到一个高维核空间,然后在映射后的核空间中进行费舍尔判别分析。KFDA有效的解决了原始数据间的非线性可分问题,因此更适合物流企业的客户分类情况。但是,FDA以及KFDA属于有监督降维算法,事先需要大量标签信息才能获得较好的泛化性能。然而在现实生活中,尤其是对海量高维的物流企业客户数据进行标签是非常费时费力的工作,因此常常出现只有少量有标签样本存在而大量无标签样本剩余的情况。由于缺少足够的有标签样本,FDA及其改进算法通常会出现过拟合现象进而导致泛化性能严重下降。因此,如何利用这些大量的无标签样本指导有监督降维学习成为了学者们关注的重点。鉴于此,为了能利用大量无标签样本提高算法判别性能,本发明首先利用核函数将原始空间样本数据映射到高维特征空间中;然后通过有标签样本和无标签样本构建低密度分割几何距离测度上的内蕴结构一致性假设,使其作为正则化项整合到费舍尔判别分析的目标函数中;最后通过求解最小化目标函数获得最优投影矩阵。由于本发明提出的基于低密度分割几何距离的半监督KFDA算法属于半监督学习算法,非常适用于物流企业的客户分类。
发明内容:
本发明目的是提供一种基于半监督核费舍尔判别分析物流企业客户分类方法。
上述目的通过以下的技术方案实现:
1、一种基于半监督核费舍尔判别分析物流企业客户分类方法,其特征在于:该方法包括以下步骤:
(1)确定物流企业有关客户的分类指标和类别,设有d个分类指标和c个客户类别,一般将物流企业客户分为四种类别:铂金客户,黄金客户,钻石客户和普通客户;
(2)根据步骤(1)确定的物流企业客户分类指标和类别,收集物流企业的各种指标信息,设有m个客户,其中有类别标签客户个数为n,n<<m,对指标信息数值化后生成样本矩阵,令代表有分类标签客户样本数据矩阵,代表总体客户样本数据矩阵;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北林业大学,未经东北林业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910583612.0/2.html,转载请声明来源钻瓜专利网。