[发明专利]基于人工智能的目标数据处理方法、装置、设备和介质在审
申请号: | 202110942022.X | 申请日: | 2021-08-17 |
公开(公告)号: | CN113609121A | 公开(公告)日: | 2021-11-05 |
发明(设计)人: | 亓宁;崔雪宁;张又允;李燕婷;刘剑 | 申请(专利权)人: | 平安资产管理有限责任公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 姜晓云 |
地址: | 200135 上海市浦东新区自*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人工智能 目标 数据处理 方法 装置 设备 介质 | ||
本申请涉及一种基于人工智能的目标数据处理方法、装置、设备和介质,包括:获取目标数据,对目标数据进行计算得到对应的指标数据;使用预设的至少两种指标筛选方法对指标数据进行筛选得到当前指标数据;对当前指标数据进行多重共线性检验以判断当前指标数据中是否存在次要指标数据;在当前指标数据中存在次要指标数据时,删除次要指标数据,对删除次要指标数据的当前指标数据重复进行筛选,以更新当前指标数据;在当前指标数据中不存在满足共线性要求的次要指标数据时,将当前指标数据作为剩余的指标数据;根据剩余的指标数据训练数据处理模型,根据所训练的数据处理模型对新增数据进行处理。采用本方法能够保证数据准确性。
技术领域
本申请涉及人工智能技术领域,特别是涉及一种基于人工智能的目标数据处理方法、装置、设备和介质。
背景技术
随着大数据技术的发展,出现了人工智能技术,通过人工智能学习大数据中的规律以从数据中获得有价值的信息。
传统技术中,对于大数据的处理,通常是使用设定的规则进行数据清洗,然后输入至模型中,进而得到对应的有价值的信息。
然而,这样对数据清洗的规则是不变的,且规则通常仅包括简单的数据填充等,从而导致后续所得到的有价值的信息存在误差。
发明内容
基于此,有必要针对上述技术问题,提供一种能够保证数据准确性的基于人工智能的目标数据处理方法、装置、设备和介质。
一种基于人工智能的目标数据处理方法,所述基于人工智能的目标数据处理方法包括:
获取目标数据,并对所述目标数据进行计算得到对应的指标数据;
使用预设的至少两种指标筛选方法对所述指标数据进行筛选,得到当前指标数据;
对所述当前指标数据进行多重共线性检验以判断当前指标数据中是否存在次要指标数据,其中,所述次要指标数据为共线性满足共线性要求的指标数据;
在所述当前指标数据中存在所述次要指标数据时,删除所述次要指标数据,并对删除所述次要指标数据的当前指标数据重复进行筛选,以更新所述当前指标数据;
在所述当前指标数据中不存在满足共线性要求的次要指标数据时,将所述当前指标数据作为剩余的指标数据;
根据所述剩余的指标数据训练数据处理模型,并根据所训练的数据处理模型对新增数据进行处理。
在其中一个实施例中,所述使用预设的至少两种指标筛选方法对所述指标数据进行筛选,得到当前指标数据,包括以下至少两种:
将所述指标数据由少到多依次增加至基于逻辑回归的指标数据筛选模型中,并每次选取贡献度最大的指标数据;
将所述指标数据全部输入至基于逻辑回归的指标数据筛选模型中,并依次删除贡献度最小的指标数据;
依次将每个指标数据与目标进行逻辑回归,按照对所述目标的贡献度对所述指标数据进行排序,按照所述排序依次将所述指标数据引入,并在引入所述指标数据后对已引入的所有指标数据进行检验以删除贡献度低的指标数据,直至所有的指标数据均处理完成。
在其中一个实施例中,所述将所述当前指标数据作为剩余的指标数据之后,还包括:
将所述剩余的指标数据与预先生成的指标数据与业务含义表进行匹配;
当所述剩余的指标数据与预先生成的指标数据与业务含义表不匹配时,输出不匹配的所述剩余的指标数据,并接收针对不匹配的所述剩余的指标数据的处理指令;
当所述处理指令为删除时,则删除所述不匹配的剩余的指标数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安资产管理有限责任公司,未经平安资产管理有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110942022.X/2.html,转载请声明来源钻瓜专利网。