[发明专利]基于大数据的学生成绩预测方法、系统、计算机及介质在审
申请号: | 202111534143.7 | 申请日: | 2021-12-15 |
公开(公告)号: | CN114492156A | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 钟晓迪;汪凡;陈国镇;徐凯;韩高强 | 申请(专利权)人: | 三盟科技股份有限公司 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06F16/245;G06F16/28;G06Q10/04;G06Q50/20;G06K9/62;G06F111/06;G06F111/08 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 曹万菊 |
地址: | 510000 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 数据 学生 成绩 预测 方法 系统 计算机 介质 | ||
本发明公开了一种基于大数据的学生成绩预测方法,包括:获取各年级学生的成绩数据;对所述成绩数据进行预处理;将经过预处理的成绩数据划分为训练集和测试集;根据LightGBM和Hyperopt算法构建初始学生成绩预测模型;根据所述训练集和测试集分别对所述初始学生成绩预测模型进行训练和测试,进而获得最终学生成绩预测模型;根据所述最终学生成绩预测模型对学生的成绩进行预测。本发明还公开了一种基于大数据的学生成绩预测系统、计算机设备及可读存储介质。采用本发明,能够融合多维数据并提高数据的可利用价值,且能够提高学生成绩的预测精度。
技术领域
本发明涉及大数据领域,尤其涉及一种基于大数据的学生成绩预测方法、系统、计算机及介质。
背景技术
在当今“互联网+”时代,随着计算机存储和计算能力的提升,为大量数据进行存储和分析提供了有力的技术支持,并在各个行业领域内得到广泛充分的应用。高校大学生的行为日益受到关注。由于技术的普及,对大学生的日常行为活动进行记录并分析已日趋普遍。那么如何获取大学生的日常行为数据并进行处理和分析,是至关大学生心理健康干预疏导、大学生行为预警发现、大学生学业成绩预警、大学生就业导向推荐的重要举措。当今校园中,部分学生受到社会的不良影响,出现不同程度的心理问题,表现出行为异常、成绩下滑等信号特征,如果能够利用学生产生的日常数据进行个性化的预警,便于高校管理人员及时进行心理干预,将有利于大学生的心理健康。
然而,现有的成绩预测技术缺乏对教育大数据的异构融合方法。现有的成绩预测算法存在预测精度低以及模型需要调参的问题。
发明内容
本发明所要解决的技术问题在于,提供一种基于大数据的学生成绩预测方法、系统、计算机及介质,能够融合多维数据并提高数据的可利用价值,且能够提高学生成绩的预测精度。
为了解决上述技术问题,本发明提供了一种基于大数据的学生成绩预测方法,包括:获取各年级学生的成绩数据;对所述成绩数据进行预处理;将经过预处理的成绩数据划分为训练集和测试集;根据LightGBM和Hyperopt算法构建初始学生成绩预测模型;根据所述训练集和测试集分别对所述初始学生成绩预测模型进行训练和测试,进而获得最终学生成绩预测模型;根据所述最终学生成绩预测模型对学生的成绩进行预测。
优选地,所述获取各年级学生的成绩数据的步骤包括:根据Spark引擎,从Hive数据库中获取各年级学生的成绩数据。
优选地,所述对所述成绩数据进行预处理的步骤包括:通过Spark引擎的弹性分布式数据及RDD对所述成绩数据进行预处理,其中,所述预处理包括删除缺失值和异常值、数据类型的规范和转换,多源异构数据集的融合以及自变量和因变量的统一。
优选地,所述根据LightGBM和Hyperopt算法构建初始学生成绩预测模型的步骤包括:根据LightGBM算法构建原始学生成绩预测模型;根据Hyperopt算法采用模拟退火策略对所述原始学生成绩预测模型进行参数调优,进而获得初始学生成绩预测模型,其中,所述模拟退火策略如下:初始化时,初始温度T(充分大),温度下限Tmin(充分小),算法初始解x,每个T值的迭代次数L,对l=1,2,…,L,重复步骤1至步骤3,
步骤1,产生新解xnew=x+△x,其中,△x为[dmin,dmax]之间的随机数,
步骤2,计算△f=f(xnew)-f(x),其中f(x)为优化目标函数,若△f0则接受xnew作为新的当前解,否则以概率exp(-△f/(kT))接受xnew作为新的当前解,
步骤3,当连续m个新解都没有被接受时或者满足结束条件时,输出当前解作为最优解,并退出所述模拟退火策略。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三盟科技股份有限公司,未经三盟科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111534143.7/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置