[发明专利]一种无监督聚类与时空域深度网络相结合的篮球视频群体行为识别方法有效
申请号: | 201910604999.3 | 申请日: | 2019-07-05 |
公开(公告)号: | CN110348364B | 公开(公告)日: | 2021-07-02 |
发明(设计)人: | 毋立芳;李则昱;杨洲;简萌 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 刘萍 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种无监督聚类与时空域深度网络相结合的篮球视频群体行为识别方法属于篮球视频中的语义事件自动识别领域。该方案首先利用光流估计方法,从连续视频帧中获得运动场属性。然后提取运动特征直方图(MCH)作为运动场表征的描述符。随后,提出了一种基于聚类的运动场标签生成方法。将聚类后生成的标签代替原本定义的组活动标签作为运动场的监督信号来训练CNN模型,可以更有效地表示运动场的特征。最后,将CNN模型的输出特征输入到LSTM结构中进行语义事件识别。此发明对篮球视频数据智能化管理、篮球技战术分析和自动转播等应用奠定了基础。 | ||
搜索关键词: | 一种 监督 时空 深度 网络 相结合 篮球 视频 群体 行为 识别 方法 | ||
【主权项】:
1.一种无监督聚类与时空域深度网络相结合的篮球视频群体行为识别方法,其特征在于,包括以下步骤:1)运动场特征表达运动场是运动信息表示和结构化数据建模的理想数据形式;用光流来表示运动场;PWC‑Net估计的光流场包含两个通道,分别表示水平方向(x方向)和垂直方向(y方向)对应的像素位移;设计运动特征直方图特征来描述运动数据,根据像素点的运动幅度和运动方向(x,y方向夹角)将每个点量化,用9个类别表达量化空间;对运动场中所有量化点进行类别统计,提出统计特征运动特征直方图;运动特征直方图表达了不同类别的分布;对图片进行分块,分别按顺序统计每块图片区域的运动特征直方图并连接起来作为整幅图片的运动特征直方图;2)基于无监督聚类的标签生成基于提取的运动特征直方图进行层次聚类,取训练集中的几场比赛视频做层次聚类,对每个类别中的特征取平均值作为这个类别的基准特征,基准特征可以很好的代表这个类别;对于任意一张输入图片,计算其运动特征直方图,然后和每个类别的基准特征比较,计算运动特征直方图和各类基准特征的余弦距离,余弦距离数值最小所对应的基准特征类即为图片所属类,基准特征类标签即为图片标签,以此实现图片自动标注标签;3)基于LSTM的群体活动识别方法采用ConvLSTM结构进行时空数据建模和群体活动识别;利用VGG‑11结构,在每一个卷积层之后都使用batch normalization层来表示运动场的特征;通过基于无监督聚类的标签生成方法,确定每个输入运动场的监督信号;通过深度神经网络结构,提取运动场的语义级特征表示,进一步进行时间建模;提取VGG‑11网络中第二个全连接层的特征向量作为运动场的表示;然后利用长短时记忆网络LSTM对视频片段中连续时间节点的运动场特征进行整合,进一步进行群体活动推理。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910604999.3/,转载请声明来源钻瓜专利网。