[发明专利]一种基于单帧监督的时序行为检测方法及系统有效
申请号: | 202110291231.2 | 申请日: | 2021-03-18 |
公开(公告)号: | CN112926492B | 公开(公告)日: | 2022-08-12 |
发明(设计)人: | 宋砚;王彬;舒祥波 | 申请(专利权)人: | 南京理工大学 |
主分类号: | G06V40/20 | 分类号: | G06V40/20;G06V10/764;G06V10/80;G06K9/62 |
代理公司: | 北京高沃律师事务所 11569 | 代理人: | 刘凤玲 |
地址: | 210094 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 监督 时序 行为 检测 方法 系统 | ||
1.一种基于单帧监督的时序行为检测方法,其特征在于,包括:
构建初始时序行为检测模型;所述时序行为检测模型包括:视频处理模块、分类融合模块和动作背景挖掘模块;
将训练视频输入所述视频处理模块中,提取所述训练视频中图像帧和光流帧的时空特征,得到时空特征集;并对所述训练视频进行单帧标注,得到标注帧;所述时空特征集包括图像时空特征和光流时空特征;所述标注帧包括实际的动作发生的一个时间戳和动作类别;
将所述时空特征集输入所述分类融合模块中进行snippet分类,并将分类结果进行融合,得到嵌入特征集、动作分数集、类激活序列集和注意力分数集;
将所述动作分数集、所述类激活序列集和所述标注帧输入所述动作背景挖掘模块中,得到输入视频中的动作区域和背景区域;
将所述标注帧作为监督信息,根据所述动作分数集、所述类激活序列集、所述注意力分数集和所述动作区域和所述背景区域对所述初始时序行为检测模型进行训练,得到第一时序动作检测模型;
将所述动作区域和所述背景区域作为监督信息,根据所述嵌入特征集、所述动作分数集、所述类激活序列集和所述注意力分数集对所述第一时序动作检测模型进行训练,得到第二时序动作检测模型;
将测试视频输入所述第二时序动作检测模型进行预测,得到预测的动作发生时间和动作类别;
将所述时空特征集输入所述分类融合模块中进行snippet分类,并将分类结果进行融合,得到嵌入特征集、动作分数集、类激活序列集、注意力分数集,包括:
将所述图像时空特征和所述光流时空特征分别输入到所述分类融合模块中的特征嵌入子模块中进行提取,得到图像嵌入特征和光流嵌入特征;
将所述图像时空特征和所述光流时空特征分别输入到所述分类融合模块中的类无关分类子模块中进行提取,得到图像动作分数和光流动作分数;
将所述图像时空特征和所述光流时空特征分别输入到所述分类融合模块中的类相关分类子模块中进行提取,得到图像类激活序列和光流类激活序列;
将所述图像时空特征和所述光流时空特征分别输入到所述分类融合模块中的注意力子模块中进行提取,得到图像注意力分数和光流注意力分数;
将所述图像嵌入特征和所述光流嵌入特征输入到所述分类融合模块中的双流融合子模块中进行融合,得到融合嵌入特征;
将所述图像动作分数和所述光流动作分数输入到所述双流融合子模块中进行融合,得到融合动作分数;
将所述图像类激活序列和所述光流类激活序列输入到所述双流融合子模块中进行融合,得到融合类激活序列;
将所述图像注意力分数和所述光流注意力分数输入到所述双流融合子模块中进行融合,得到融合注意力分数;
所述嵌入特征集包括所述图像嵌入特征、所述光流嵌入特征和所述融合嵌入特征;所述动作分数集包括所述图像动作分数、所述光流动作分数和所述融合动作分数;所述类激活序列集包括所述图像类激活序列、所述光流类激活序列和所述融合类激活序列;所述注意力分数集包括所述图像注意力分数、所述光流注意力分数和所述融合注意力分数。
2.根据权利要求1所述的基于单帧监督的时序行为检测方法,其特征在于,所述视频处理模块的确定方法为:
获取Kinetics数据集和初始I3D模型;
根据所述Kinetics数据集对所述初始I3D模型进行训练,得到所述视频处理模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110291231.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种车载式防高空坠物的方法和装置
- 下一篇:一种电脑主板的防尘散热结构