[发明专利]高维数据分类方法、装置及终端设备在审
申请号: | 201810909030.2 | 申请日: | 2018-08-10 |
公开(公告)号: | CN109242002A | 公开(公告)日: | 2019-01-18 |
发明(设计)人: | 马超 | 申请(专利权)人: | 深圳信息职业技术学院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/28;G06N3/00 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 张全文 |
地址: | 518000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明适用于计算机技术领域,提供了一种高维数据分类方法及装置;其中,方法包括:获取预定数量的原始高维数据样本集,原始高维数据包括表征数据属性特征的特征值;对原始高维数据样本集进行特征降维处理,得到特征降维处理后的高维数据子集;基于特征降维处理后的高维数据子集,利用二进制乌鸦搜索进化算法对特征值进行筛选,获得最优特征子集;根据旋转森林算法对最优特征子集中的样本的属性集进行随机分割和组合,对分割的各组子属性集间的数据进行特征变换,得到差异性大于预定阈值的训练数据集,基于训练数据集构建高维分类模型;根据高维分类模型对目标高维数据进行分类。本发明能够减少了计算成本,提高了对高维数据的分类精度。 | ||
搜索关键词: | 高维数据 特征降维 最优特征子集 分类 训练数据集 分类模型 样本集 高维 子集 计算机技术领域 二进制 表征数据 进化算法 属性特征 特征变换 终端设备 属性集 子属性 分割 构建 算法 异性 样本 搜索 筛选 森林 | ||
【主权项】:
1.一种高维数据分类方法,其特征在于,包括:获取预定数量的原始高维数据样本集,所述原始高维数据包括表征数据属性特征的特征值;对所述原始高维数据样本集进行特征降维处理,得到特征降维处理后的高维数据子集;基于特征降维处理后的所述高维数据子集,利用二进制乌鸦搜索进化算法对所述特征值进行筛选,获得最优特征子集;根据旋转森林算法对所述最优特征子集中的样本的属性集进行随机分割和组合,对分割的各组子属性集间的数据进行特征变换,得到差异性大于预定阈值的训练数据集,基于所述训练数据集构建高维分类模型;根据所述高维分类模型对目标高维数据进行分类。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳信息职业技术学院,未经深圳信息职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810909030.2/,转载请声明来源钻瓜专利网。