[发明专利]基于KNN算法的数据分析方法、装置、设备及存储介质在审
| 申请号: | 202111063263.3 | 申请日: | 2021-09-10 |
| 公开(公告)号: | CN113780581A | 公开(公告)日: | 2021-12-10 |
| 发明(设计)人: | 李希加 | 申请(专利权)人: | 未鲲(上海)科技服务有限公司 |
| 主分类号: | G06N20/00 | 分类号: | G06N20/00;G06N3/04;G06N3/08 |
| 代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强 |
| 地址: | 200135 上海市浦东新区*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 knn 算法 数据 分析 方法 装置 设备 存储 介质 | ||
本申请涉及人工智能技术领域,提供了一种基于KNN算法的数据分析方法、装置、设备及存储介质,其中方法包括:接收数据分析指令;若所述数据分析指令对应的数据集中存在缺失数据,则基于所述缺失数据的属性获取所述缺失数据的关联数据;基于KNN算法对所述缺失数据的属性和所述数据集,以及所述关联数据和所述关联数据的属性进行处理,得到所述缺失数据的目标预测值;基于所述目标预测值和所述数据集进行数据分析。采用本申请,能够预测缺失的数据,可提高数据分析的准确率,有利于提高模型训练的精确度和模型识别的准确率。
技术领域
本申请涉及人工智能技术领域,主要涉及了一种基于KNN算法的数据分析方法、装置、设备及存储介质。
背景技术
在人工智能(Artificial Intelligence,AI)模型训练过程中,经常需要大量的数据进行训练。然而,待训练的原始数据和待识别的原始数据中可能存在缺失的数据。例如,公司财报中的净资产收益、全部债务、负债合计等涉及公司经营状态,可能为缺失的数据,从而导致对该公司的经济状态的数据分析失败或准确率低。
目前,通常采用全部填充0,或者平均值,或者中位数的方式对缺失的数据进行填充。以上三种填充方式简单粗暴,不能反映样本的真实面貌,导致数据分析失败或分析的准确率低。
发明内容
本申请实施例提供了一种基于KNN算法的数据分析方法、装置、设备及存储介质,能够预测缺失的数据,可提高数据分析的成功率和准确率,有利于提高模型训练的精确度和模型识别的准确率。
第一方面,本申请实施例提供一种基于KNN算法的数据分析方法,其中:
接收数据分析指令;
若所述数据分析指令对应的数据集中存在缺失数据,则基于所述缺失数据的属性获取所述缺失数据的关联数据;
基于KNN算法对所述缺失数据的属性和所述数据集,以及所述关联数据和所述关联数据的属性进行处理,得到所述缺失数据的目标预测值;
基于所述目标预测值和所述数据集进行数据分析。
第二方面,本申请实施例提供一种基于KNN算法的数据分析装置,其中:
通信单元,用于接收数据分析指令;
获取单元,用于若所述数据分析指令对应的数据集中存在缺失数据,则基于所述缺失数据的属性获取所述缺失数据的关联数据;
处理单元,用于基于KNN算法对所述缺失数据的属性和所述数据集,以及所述关联数据和所述关联数据的属性进行处理,得到所述缺失数据的目标预测值;基于所述目标预测值和所述数据集进行数据分析。
第三方面,本申请实施例提供一种计算机设备,包括处理器、存储器、通信接口以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,所述程序包括用于如第一方面中所描述的部分或全部步骤的指令。
第四方面,本申请实施例提供了一种计算机可读存储介质,其中,所述计算机可读存储介质存储计算机程序,其中,所述计算机程序使得计算机执行以实现如第一方面中所描述的部分或全部步骤。
实施本申请实施例,将具有如下有益效果:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于未鲲(上海)科技服务有限公司,未经未鲲(上海)科技服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111063263.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高温材料生产用模具设备
- 下一篇:一种地质勘探沉降监测装置及调节方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





