[发明专利]基于动态规划和K-means聚类的特征选择算法在审
申请号: | 201610363758.0 | 申请日: | 2016-05-26 |
公开(公告)号: | CN106022385A | 公开(公告)日: | 2016-10-12 |
发明(设计)人: | 董敏;曹丹;刘皓熙;毕盛 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 罗观祥 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于动态规划和K‑means聚类的特征选择算法,包括步骤:1)数据预处理,主要解决特征数据中存在的数据重复、数据属性值缺失问题;2)借助动态规划的核心思想预选择出特征子集,并且采用类间类内距离作为动态规划决策过程中的性能函数;3)改进原始的K‑means聚类算法,并且使用改进后的K‑means算法对动态规划阶段生成的特征子集进行聚类,剔除冗余特征,优化选择出的特征子集。本发明能够选择出低噪声、强相关、无冗余的特征子集,实现特征的有效降维,提高机器学习算法的泛化能力和学习效率,降低算法的运行时间,最终生成一个简单高效且易于理解的学习模型。 | ||
搜索关键词: | 基于 动态 规划 means 特征 选择 算法 | ||
【主权项】:
基于动态规划和K‑means聚类的特征选择算法,其特征在于,包括以下步骤:1)数据预处理,主要解决特征数据中存在的数据重复、数据属性值缺失问题;2)借助动态规划的核心思想预选择出特征子集,并且采用类间类内距离作为动态规划决策过程中的性能函数;3)改进原始的K‑means聚类算法,重点集中在确定聚类个数及选取初始中心点这两方面对原始的K‑means聚类算法进行优化改进,并且引入加权欧氏距离,其改进思想是:使用迭代法确定聚类个数,利用标准差进行加权欧氏距离的计算,采用加权欧氏距离以及最大最小距离的原理进行初始中心点的选取;最后使用改进后的K‑means算法对动态规划阶段生成的特征子集进行聚类,剔除冗余特征,优化选择出的特征子集。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610363758.0/,转载请声明来源钻瓜专利网。