[发明专利]基于多特征融合的视频描述方法有效
申请号: | 201710281305.8 | 申请日: | 2017-04-26 |
公开(公告)号: | CN107256221B | 公开(公告)日: | 2020-11-03 |
发明(设计)人: | 刘纯平;徐鑫;林欣;刘海宾;季怡 | 申请(专利权)人: | 苏州大学 |
主分类号: | G06F16/74 | 分类号: | G06F16/74;G06F40/134;G06K9/00;G06K9/62 |
代理公司: | 北京市科名专利代理事务所(特殊普通合伙) 11468 | 代理人: | 郭杨 |
地址: | 215123 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于多特征融合的视频描述方法,其特征在于:1)通过融合传统CNN特征和SIFT流特征提取视频的深层时空特征;2)根据步骤1)提取的深层时空特征,采用加入以平均池化特征作为视频整体特征的S2VT句子生成模型生成相应的句子描述;3)采用word2vec词向量替换one‑hot vector词表征优化步骤2)中的句子生成模型。本方法优点是通过多特征融合,能更好地提取到更加鲁棒的时空特征,同时在句子生成模型中加入平均池化特征,以便视觉信息与单词间建立更多联系,最后采用word2vec词向量方法替换one‑hot vector词表征,在单词与单词之间建立更多的联系,有效提高视频描述性能。 | ||
搜索关键词: | 基于 特征 融合 视频 描述 方法 | ||
【主权项】:
一种基于多特征融合的视频描述方法,其特征在于:1)视频时空特征提取通过融合传统的CNN特征和SIFT流特征提取视频的深层时空特征;2)句子描述的生成根据步骤1)提取到的深层时空特征,采用加入了以平均池化特征作为视频整体特征的S2VT句子生成模型生成相应的句子描述;3)句子生成模型的优化采用word2vec词向量替换one‑hot vector词表征优化步骤2)中的句子生成模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710281305.8/,转载请声明来源钻瓜专利网。