[发明专利]基于半监督核费舍尔判别分析物流企业客户分类方法在审
申请号: | 201910583612.0 | 申请日: | 2019-06-30 |
公开(公告)号: | CN110348502A | 公开(公告)日: | 2019-10-18 |
发明(设计)人: | 陶新民;常瑞;任超;郭文杰;李青;刘锐;陶思睿 | 申请(专利权)人: | 东北林业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q30/02 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150040 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 物流企业 客户分类 矩阵 目标函数 判别分析 投影矩阵 投影坐标 半监督 归一化 客户 标准化处理 最近邻算法 分类问题 矩阵构建 矩阵计算 客户类别 客户信息 数据样本 样本数据 正则化项 最小化 分类 求解 整合 样本 集合 申请 应用 | ||
1.一种基于半监督核费舍尔判别分析物流企业客户分类方法,其特征在于:该方法包括以下步骤:
(1)确定物流企业有关客户的分类指标和类别,设有d个分类指标和c个客户类别,一般将物流企业客户分为四种类别:铂金客户,黄金客户,钻石客户和普通客户;
(2)根据步骤(1)确定的物流企业客户分类指标和类别,收集物流企业的各种指标信息,设有m个客户,其中有类别标签客户个数为n,n<<m,对指标信息数值化后生成样本矩阵,令代表有分类标签客户样本数据矩阵,代表总体客户样本数据矩阵;
(3)对步骤(2)获取的数据样本集合进行标准化处理,将每个样本指标的数值范围确定在[0,1]之间;则归一化后有标签客户样本数据矩阵为Xn∈Rd×n;归一化后总体客户样本数据矩阵为Xm∈Rd×m;
(4)对步骤(3)获取的归一化后的总体客户样本数据矩阵Xm利用低密度分割几何距离构建一致性假设矩阵A∈Rm×m,并计算局部类间拉普拉斯矩阵Llb∈Rn×n和局部类内拉普拉斯矩阵Llw∈Rn×n;
(5)利用步骤(4)中获取的一致性假设矩阵A,计算正则化项拉普拉斯矩阵L∈Rm×m并整合到费舍尔判别分析的目标函数中,并通过求解最小化目标函数获得最优投影矩阵T∈Rd×r,r是降维后空间维度,通常令r=(c-1);
(6)将步骤(3)归一化后总体客户样本数据矩阵Xm通过步骤(5)得到的最优投影矩阵T进行投影计算得到投影坐标Ym∈Rr×m;
(7)对步骤(6)获取的投影坐标Ym,利用最近邻分类算法求解所有未标签客户样本数据和新样本对应的客户分类。
2.根据权利要求1所述的基于半监督核费舍尔判别分析物流企业客户分类方法,其特征在于,步骤(3)中对每个指标进行标准化所采用的方法是最大最小法,其体步骤如下:设然后其中的一个指标j进行标准化处理:
。
3.根据权利要求1所述的基于半监督核费舍尔判别分析物流企业客户分类方法,其特征在于,步骤(4)中低密度分割几何距离的具体描述如下:
将归一化后的总体客户样本数据矩阵Xm定义为图G=(V,E)的顶点V,令p∈Vl表示为图上连接点p1与p|p|的一条长度为l=|p|-1的路径,其中边(pk,pk+1)∈E,E是边集。令pij表示连接数据点xi,xj的所有路径的集合,其中xi,xj∈V。则xi与xj之间的低密度分割几何距离按下式计算:
其中,|p|表示xi与xj两点间所含有的所有路径的个数,pk,pk+1表示两点i,j间的任意两点表示的是图G上顶点i和j之间最短路径距离。d(pk,pk+1)是图G上顶点xi到xj最短路径上任意相邻两点的欧式距离,ρ是调整参数,这里设置为100。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北林业大学,未经东北林业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910583612.0/1.html,转载请声明来源钻瓜专利网。