[发明专利]基于大数据的学习预警方法在审
申请号: | 201910361563.6 | 申请日: | 2019-04-30 |
公开(公告)号: | CN110189236A | 公开(公告)日: | 2019-08-30 |
发明(设计)人: | 胡挺;宋汀;夏冰;任盈盈 | 申请(专利权)人: | 南京航空航天大学 |
主分类号: | G06Q50/20 | 分类号: | G06Q50/20;G06Q10/04;G06K9/62 |
代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 贺翔 |
地址: | 210016 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 预警 大数据 支持向量机分类器 多元线性回归 近邻算法 聚类分析 课程成绩 思想动态 学生成绩 学生学习 预测模型 质量提升 课程 预测 聚类 粗糙 集合 成绩 采集 学习 挖掘 干预 学科 教学 学生 | ||
1.基于大数据的学习预警方法,其特征在于,所述预警方法包括以下步骤:
步骤一,以学校或某一学院为对象,采集该对象中全部学生全部学科的现有的绩点成绩;
步骤二,通过聚类分析得到初步的相关性课程,之后通过近邻算法结合核支持向量机分类器在聚类得到的粗糙集合中挖掘课程间更深层次的联系;
步骤三,基于多元线性回归方法得出各必修课预测模型,根据现有学期的相关课程成绩,在学期初预测各门重要必修课的成绩。
2.根据权利要求1所述的基于大数据的学习预警方法,其特征在于,所述步骤二中,首先,通过高斯核的谱聚类算法将课程进行聚类,将全部课程间的关系采用点与点之间的距离来描述:
通过计算所有点之间的欧氏距离wij=||xi-xj||2来构造一个距离矩阵W,之后通过高斯核函数来构造相似矩阵S,其中sij=kij,接下来,谱聚类算法在构造度矩阵D,在非对角线上的元素设为0,再构造拉普拉斯矩阵L=D-W,将拉普拉斯矩阵标准化后对它求前k个最小的特征值对应的特征向量,构造出一个n
d的矩阵,再对该矩阵进行k均值聚类得到簇划分结果C={C1,C2,...,Ck};xi是第i个样本,特征列向量,kij是高斯核函数,sij是矩阵里的数列;
其次,定义如下的高斯混合分布模型为概率密度函数:
该分布共由k个混合成分构成,每个混合成分对应一个高斯分布,其中μi与是第i个高斯混合成分的参数,而αi>0为相应的混合系数,PM(x)是高斯混合分布;
通过已有的学生成绩样本点的采样,估计出该学生的学习能力所对应的概率密度函数;
再进一步用所述概率密度函数对未开课课程进行预测。
3.根据权利要求2所述的基于大数据的学习预警方法,其特征在于,对所述高斯核函数的求解过程具体为:
根据高斯核函数把距离矩阵转换为相似矩阵,这样距离近的点相似度大,距离远的点相似度小,之后建立拉普拉斯矩阵L=D-W,用求出拉普拉斯矩阵的前k个最小特征值对应的k个特征向量,在归一化得到n×k的矩阵,再对它进行kmeans聚类得到最终的聚类结果。
4.根据权利要求3所述的基于大数据的学习预警方法,其特征在于,步骤三中,将先上的学期课程设定为已结课的课程,而后上的学期的课程设定为未结课的课程;采用分类方法,将成绩按照得分成若干类;
以已结课的课程为训练数据,已结课的课程为特征,某一门未结课的课程为标签,将成绩预测转换成类别预测,建立分类问题,采用XGBoost算法,相关课程的评判采用判定特征重要度的高低,特征重要度定义为以该特征在某一类成绩中分裂的次数的总和。
5.根据权利要求4所述的基于大数据的学习预警方法,其特征在于,所述步骤三中,根据softmax函数计算出后续课程预测成绩属于类别i的概率,
设输出的类别为a1,a2,a3,a4,a5,a6……an,对每个学生成绩样本,它属于类别i的概率为
对softmax函数进行求导,代入softmax函数表达式,可以得到:
当i=j时,
当i≠j时:
其中aj对应学生成绩样本;
得出预测出的后续课程成绩在每一个类别的概率分布,为已结课课程对后续课程相关性的统计学概率分布。
6.根据权利要求2所述的基于大数据的学习预警方法,其特征在于,成绩按照得分成若干类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910361563.6/1.html,转载请声明来源钻瓜专利网。