[发明专利]基于EM算法和KNN算法的数据预处理方法在审
申请号: | 201911392045.7 | 申请日: | 2019-12-30 |
公开(公告)号: | CN111046977A | 公开(公告)日: | 2020-04-21 |
发明(设计)人: | 唐雪飞;黄永鑫;蒲高飞;胡茂秋 | 申请(专利权)人: | 成都康赛信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/215 |
代理公司: | 成都虹盛汇泉专利代理有限公司 51268 | 代理人: | 刘冬静 |
地址: | 610054 四川省成都市成华区*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于EM算法和KNN算法的数据预处理方法,包括以下步骤:S1、将原始数据集按照属性值是否缺失分为完备数据子集和不完备数据子集,将完备数据子集作为EM算法的训练样本,使用EM算法进行聚类;S2、使用KNN算法在聚类结果上进行缺失值填补。本发明在使用KNN进行缺失值填补之前,先使用EM算法对原始数据集进行聚类分析,然后再在得到的聚类结果之上使用KNN来进行缺失值填补,操作简单、填充准确率高。 | ||
搜索关键词: | 基于 em 算法 knn 数据 预处理 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都康赛信息技术有限公司,未经成都康赛信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911392045.7/,转载请声明来源钻瓜专利网。
- 上一篇:一种智能井盖
- 下一篇:电动车充电门充电口充电枪智能识别方法和装置