[发明专利]基于机器学习的Wordle预测方法在审
申请号: | 202310268049.4 | 申请日: | 2023-03-20 |
公开(公告)号: | CN116351068A | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 向绍俊;陈贵词;张静;李泽鹏 | 申请(专利权)人: | 武汉科技大学 |
主分类号: | A63F13/70 | 分类号: | A63F13/70;A63F13/80;G06F18/2321;G06F18/2413;G06N5/01;G06N20/20;G06F17/18 |
代理公司: | 重庆市信立达专利代理事务所(普通合伙) 50230 | 代理人: | 杨逍 |
地址: | 430065 湖北省*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 机器 学习 wordle 预测 方法 | ||
1.基于机器学习的Wordle预测方法,其特征是:具体包括以下步骤:
S1:数据预处理;
S2:建立自回归时间序列模型(ARIMA),对已经存在的数据进行分析,并预测未来一天的报告数量;
S3:给予单词属性计算出相关性系数;
S4:建立随机森林(RF)模型,确定最优模型的超参数,求出影响百分比的相关特征,根据特征的重要性进行排序,求出百分比;再利用最优模型,对EERIE一词的百分比进行预测;
S5:采用高斯混合聚类模型对多个等级进行聚类,将样本分为三个标签,通过KNN算法模型对单词难度进行分类预测,最后确定给定单词的预测等级。
2.根据权利要求1所述的基于机器学习的Wordle预测方法,其特征是:所述S1的具体步骤是:
S1-1:对数据进行归一化处理,即:
S1-2:对不合理的单词和数据进行删除、替换或修改。
3.根据权利要求1所述的基于机器学习的Wordle预测方法,其特征是:所述S2的具体步骤是:
S2-1:对自回归时间序列模型(ARIMA)时间序列预处理,包括平稳性检验和白噪声检验;
S2-2:通过确定模型的自相关阶数来确定选用的具体模型;
S2-3:通过残差检验来对模型进行验证;
S2-4:当模型拟合效果较好时,通过模型对报告结果数量进行预测;
S2-5:通过平均绝对误差和均方误差根来对模型进行评价;
其中平均绝对误差为:
均方误差根为:
4.根据权利要求1所述的基于机器学习的Wordle预测方法,其特征是:所述S3的具体步骤是:
S3-1:选取对报告分数百分比影响较大的单词属性来计算分数百分比的占比,选取5个单词属性,与玩困难模式的比率结合,组成6个维度,以此建立相关性分析模型;
S3-2:计算各个维度之间的相关系数,相关系数
其中sx,sy表示样本标准差:
5.根据权利要求1所述的基于机器学习的Wordle预测方法,其特征是:所述S4的具体步骤是:
S4-1:建立随机森林模型并进行测试和评价;
S4-2:利用训练好的数据对未来日期相关百分比进行预测,并根据每次猜测的指标重要程度来预测未来出现EERIE一词的报告结果分布的百分比;
S4-3:通过选择不同的划分比例,分别计算模型评价指标的值;
S4-4:确定随机森林模型的超参数的范围,在范围内使用网格搜索确定各个超参数的最优取值。
6.根据权利要求1所述的基于机器学习的Wordle预测方法,其特征是:所述S5中聚类的具体方法是:
1):使用Akaike information criterion(AIC)或Bayesian information criterion(BIC)来确定最佳聚类数目;
2):通过轮廓系数对高斯混合聚类模型进行评价,最终得出总轮廓系数值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉科技大学,未经武汉科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310268049.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种低缺陷硬质合金的激光增材制造方法
- 下一篇:激光雷达标定方法、装置和设备