[发明专利]一种基于特征选择和参数优化的冰球赛况预测方法在审
| 申请号: | 201910525686.9 | 申请日: | 2019-06-18 |
| 公开(公告)号: | CN110263994A | 公开(公告)日: | 2019-09-20 |
| 发明(设计)人: | 薛善良;程思嘉;李梦颖;肖雪 | 申请(专利权)人: | 南京航空航天大学 |
| 主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06K9/62;G06N3/12 |
| 代理公司: | 南京天华专利代理有限责任公司 32218 | 代理人: | 瞿网兰 |
| 地址: | 210016 江*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 冰球 支持向量机 参数优化 特征选择 预测 惩罚因子 预测模型 核函数 特征选择算法 冰球比赛 交叉验证 能力影响 数据集中 特征保留 范数 去除 算法 稀疏 优化 | ||
1.一种基于特征选择和参数优化的冰球赛况预测方法,其特征是它包括如下步骤:
步骤1:对获取的待预测的冰球比赛数据进行数据标准化处理,得到冰球比赛数据集,即通过函数变换使数据映射到特定区间;
步骤2:对已进行过数据标准化处理的冰球比赛数据集再一次使用基于稀疏表达思想和用L1范数最小化优化方法处理,获得冰球数据特征的稀疏表示重构系数,并将原始特征和重构特征的误差作为该特征的稀疏分数;
步骤3:计算待处理的冰球比赛数据集中,拉普拉斯改进标准分类特征与每个特征变量的相关性;
步骤4:根据步骤2和步骤3计算得到冰球比赛关键特征的稀疏分数以及分类类别与特征的相关关系,分析特征的稀疏分数与该特征和类别的相关性之间的相互关系提出冗余特征,实现特征选择;
步骤5:通过混合GAPSO算法优化支持向量机的惩罚因子C以及核函数参数g,实现支持向量机的参数优化;
步骤6:采用K折交叉验证,输出冰球比赛预测结果。
2.根据权利要求1所述的预测方法,其特征是步骤2中计算冰球比赛数据集中各个特征的稀疏分数包括如下步骤:
步骤2.1:对待处理的冰球比赛数据集,使用基于稀疏表达思想和用L1范数最小化优化方法以获得数据特征的稀疏表示重构系数;对于一个给定的冰球比赛数据集其中xi∈Rd,令数据矩阵X=[x1,x2,…,xn]∈Rd×n中的每列作为该数据集的特征向量;用公式对所有数据向量Xi计算基于稀疏表示的重构系数si;其中,X′是X不包含xi的数据矩阵;n维系数向量si=[si1,…,sii-1,0,sii+1,…,sin]T,因为在计算重构稀疏si时,没有将xi包含在X里面,因此sii=0;同时,sij,j≠i则表示数据向量xj对于重构xi所做的贡献;
步骤2.2:用对每个特征在整个冰球比赛数据集样本上的重构误差求和,获得在整个冰球比赛数据集上的各个特征的稀疏表示保留能力即特征的稀疏分数;其中,用于表示第r维的原始特征xir与该特征基于重构系数矩阵得到重构特征之间的误差累加结果,用Var(X(r,:))表示第r维特征的方差;
步骤2.3:将特征的稀疏分数S(r)按照升序排列。
3.根据权利要求1所述的预测方法,其特征是所述步骤3的计算方法为:对待处理冰球赛事数据集,计算其分类类别与特征变量的相关性C(i):
subject.to.k=1,2,…,d
t=1,2,…,d
Np≥1;
式中,Np表示分类类别为p的样本个数;Nn表示分类类别不是p的样本个数;表示所有冰球比赛样本中的第i维特征变量的均值;表示冰球比赛数据样本集中的分类类别为p的第i维特征变量的均值;表示冰球比赛数据样本集中的非类别p的第i维特征变量的均值;xk,ip表示第i维特征变量中第k个类别p样本的值;xt,ip表示第i维特征变量中第t个非类别p样本的值;
此时,冰球赛事中分类特征与特征变量相关性C(i)的计算结果是d维向量,当分类类别与特征之间相关关系越强时,计算得出的C(i)就越大;当分类类别与特征关系为弱相关或不相关时,计算得出的C(i)就越小,因此将相关性按照降序排列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910525686.9/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





