[发明专利]基于反事实分析的第一视角视频行为预测模型训练方法在审
| 申请号: | 202210985312.7 | 申请日: | 2022-08-17 |
| 公开(公告)号: | CN115359395A | 公开(公告)日: | 2022-11-18 |
| 发明(设计)人: | 蒋树强;张天予;闵巍庆 | 申请(专利权)人: | 中国科学院计算技术研究所 |
| 主分类号: | G06V20/40 | 分类号: | G06V20/40;G06N3/04;G06N3/08;G06V10/74;G06V10/82 |
| 代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇 |
| 地址: | 100190 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 事实 分析 第一 视角 视频 行为 预测 模型 训练 方法 | ||
本发明提供一种基于反事实分析的第一视角视频行为预测模型训练方法,采用第一视角视频训练集对预测模型进行多轮迭代训练直至收敛,其中,每轮训练包括:分别提取每个样本的视觉特征和语义特征;分别对视觉特征和语义特征进行编解码处理得到视觉特征对应的下一时刻的高维特征向量和语义特征对应的下一时刻的高维特征向量;基于高维特征向量分别获得下一时刻的反事实预测向量和事实预测向量;从每个样本对应的事实预测向量中按照相似度抠除反事实预测向量得到下一时刻的最终行为预测向量;每个样本的下一时刻的行为对应的最终预测向量与对应下一时刻的行为标签对应的向量之间的交叉熵损失更新预测模型的参数。
技术领域
本发明涉及视频图像处理领域,具体来说,涉及第一视角视频行为预测领域,更具体地说,涉及一种基于反事实分析的第一视角视频行为预测模型训练方法、行为预测方法及系统。
背景技术
第一视角行为预测是指根据一段已发生的视频片段预测接下来可能发生的行为,以参考文献[1]为代表的方案致力于从输入的视频片段中提取视觉特征,并且将这些视觉信息送入由两个级联的长短时记忆网络构成的行为预测模型中,以形成对观察内容的总结和对未来行为的假设,从而充分利用这些视觉信息实现对未来行为的预测;以参考文献[2]为代表的方案则是在视觉特征的基础上引入行为标签所包含的语义信息,将视觉特征和过去行为的语义标签一起送入行为预测模型得到基于多模态信息的预测结果,通过结合视觉和语义信息提升行为预测的性能;以参考文献[3]为代表的方案则是考虑行为之间的语义关联可能使得预测模型产生语义偏差,即受行为标签在数据集中不均衡分布的影响使得产生的预测结果更偏向于高频标签,提出了反事实分析方案,旨在保留多模态信息的基础上削弱行为标签之间的语义关联带来的副作用,使得模型更关注能够反映每个案例具体信息的视觉内容,从而进一步提升行为预测的可靠性。
相比较来说,基于反事实分析的行为预测比另外两类方案的预测可靠性更高,但是,现有技术在使用反事实分析方案去除语义信息带来的偏差时,通常的做法是首先基于视觉信息和语义信息得到事实阶段的预测结果Yf,然后仅利用过去行为的语义标签预测未来行为得到反事实阶段的预测结果Yc,最后从事实阶段的预测结果中扣除反事实阶段的预测结果,得到最终的预测结果(Yf-Yc),这种操作的方式是对Yf和Yc这两个向量直接作差,没有考虑样本与样本之间、类别与类别之间的差异性,会存在矫枉过正现象,使得一些类别的预测准确率在引入反事实分析之后下降,不能自适应地缓解语义信息带来的偏差。
参考文献:
[1]Antonino Furnari and Giovanni Maria Farinella.What Would YouExpect?Anticipating Egocentric Actions with Ro lling-Unrol ling LSTMs andModality Attention.In Proceedings of the IEEE lnternational Conference onComputer Vision 2019:6251-6260.
[2]Antoine Miech,lvan Laptev,Josef Sivic,Heng Wang,Lorenzo Torresani,and Du Tran.Leveraging the Present to Anticipate the Futurein Videos.lnProceedings of the I EEE Conferenceon Computer Vision and Pattern RecognitionWorkshops 2019.2915-2922.
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210985312.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种开关装置图案标识定制方法
- 下一篇:一种21500吨自卸船货舱舱底水系统





