[发明专利]基于机器学习的羽毛球赛事视频精彩片段提取方法在审
申请号: | 202010031201.3 | 申请日: | 2020-01-13 |
公开(公告)号: | CN111291617A | 公开(公告)日: | 2020-06-16 |
发明(设计)人: | 王美丽;罗键昆;陶树;王亦涵 | 申请(专利权)人: | 西北农林科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 西安铭泽知识产权代理事务所(普通合伙) 61223 | 代理人: | 梁静 |
地址: | 712100 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 机器 学习 羽毛球 赛事 视频 精彩 片段 提取 方法 | ||
1.一种羽毛球赛事视频精彩片段提取方法,其特征在于,包括:
获取羽毛球视频;
采用Keras框架进行迁移学习,获得视角分类模型;利用视角分类模型,对羽毛球视频进行分割,获得广播视角的羽毛球视频片段;
调用YOLOv3目标检测模型,确定运动员的重心;根据运动员的重心,确定广播视角羽毛球视频片段中整体球员平均速度,并将整体球员平均速度最大的几个广播视角羽毛球视频片段作为羽毛球视频精彩片段。
2.如权利要求1所述的羽毛球赛事视频精彩片段提取方法,其特征在于,所述羽毛球视频包括:广播视角羽毛球视频、场边视角羽毛球视频、无用视角羽毛球视频。
3.如权利要求2所述的羽毛球赛事视频精彩片段提取方法,其特征在于,还包括:采用K-Means方法对三种视角的羽毛球视频进行图像聚类,验证羽毛球视频分类的可行性;具体包括:
采用主成分分析PCA方法对图像进行降维;
指定聚类簇数为3,分别对应羽毛球视频的三种视角;
采用K-Means方法进行图像聚类;
根据聚类结果,验证羽毛球视频三种视角的分类可行性。
4.如权利要求1所述的羽毛球赛事视频精彩片段提取方法,其特征在于,所述采用Keras框架进行迁移学习,获得视角分类模型;具体包括:
采用Keras深度学习框架进行迁移学习,使用已在大型图像数据集ImageNet上训练的分类模型作为预训练模型,采用MobileNet作为三种视角分类的基础网络结构;采用深度可分离Depthwise卷积替代传统3D卷积;
对预训练模型效果进行实验,设置参数包括:输入图像大小为224×224;添加全连接层,尺寸为3;图像像素值缩放到[0,-1];优化器为SGD,学习率为0.0001,动量为0.9;损失函数为分类交叉熵;批量大小为32;迭代5次验证集损失没下降,降低一半学习率;迭代30次验证集损失没下降停止训练。
5.如权利要求4所述的羽毛球赛事视频精彩片段提取方法,其特征在于,所述根据视角分类模型,对羽毛球视频进行分割,获得广播视角羽毛球视频片段;具体包括:
依次读取一段完整羽毛球赛事视频的每一帧,每读取一帧时,做如下处理:若该帧的视角被预测为广播视角,且前一帧非广播视角时,则创建一个存储以该帧为第一帧的视频片段连续帧的存储队列,并将该帧写入此存储队列;若该帧和前一帧的视角皆被预测为广播视角,则将该帧写入最新创建的存储队列中。
6.如权利要求4所述的羽毛球赛事视频精彩片段提取方法,其特征在于,还包括:对所述视角分类模型进行可视化;具体包括:
采用t-SNE降维方法对所述视角分类模型进行可视化。
7.如权利要求5所述的羽毛球赛事视频精彩片段提取方法,其特征在于,所述通过YOLOv3目标检测模型,确定运动员的重心;具体包括:
通过YOLOv3目标检测模型对羽毛球视频片段中的每一帧进行目标为“人”的检测,根据检测框定义重心;目标检测默认人的头部在上,以目标框顶部终点为三角形顶点,目标框底部线构成该三角形的另两点,目标框左上角点为(x1,y1),目标框右下角点为(x2,y2),则重心为:
8.如权利要求7所述的羽毛球赛事视频精彩片段提取方法,其特征在于,所述根据运动员的重心,确定广播视角羽毛球视频片段中整体球员平均速度;具体包括:
以相邻两帧中检测到的最后一个球员的移动速度近似为整体速度,设第i,i+1两个相邻帧中检测到的最后一个球员的重心分别为(pi,qi),(pi+1,qi+1)则这两帧的球员整体速度为:
整个视频片段的球员平均速度定义为:
其中,N为视频片段的总帧数,T为视频片段的播放总时长。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北农林科技大学,未经西北农林科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010031201.3/1.html,转载请声明来源钻瓜专利网。