[发明专利]一种利用紧凑视频主题描述子进行视频检索的方法有效
申请号: | 201310255896.3 | 申请日: | 2013-06-25 |
公开(公告)号: | CN103279581A | 公开(公告)日: | 2013-09-04 |
发明(设计)人: | 王亮;谭铁牛;黄永祯;赵放 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 宋焰琴 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种利用基于无向主题模型的紧凑视频主题描述子进行视频检索的方法,该方法包括以下步骤:提取视频局部特征并用聚类算法得到视频的词袋(BoW)特征;利用视频词袋特征训练有稀疏约束的非负无向主题模型来学习视频的主题特征;用训练好的主题模型推断视频的主题描述子,通过计算描述子之间的余弦距离来检索视频。本发明方法能够从高维的视频词袋特征中提取出低维并且稀疏的视频主题描述,从而大大提高了在大规模数据库以及带宽受限的移动搜索系统中的检索效率;同时该方法所训练的主题模型能够很好的挖掘视频的主题特征结构,因此提取出的主题描述子即使在维数很低的情况下仍然具有比原始的高维词袋特征更高的检索精确度。 | ||
搜索关键词: | 一种 利用 紧凑 视频 主题 描述 进行 检索 方法 | ||
【主权项】:
一种利用基于无向主题模型的紧凑视频主题描述子进行视频检索的方法,其特征在于,该方法包括以下步骤:步骤S1,将视频数据集中的部分视频作为视频训练集,剩下的视频作为视频测试集;步骤S2,对所述视频数据集中的每一个视频提取其局部特征;步骤S3,从提取得到的局部特征中随机抽取足够数量的局部特征,利用聚类算法训练得到一视觉词典,并利用该视觉词典对每一个视频的局部特征进行编码得到每个视频的词袋向量v;步骤S4,将每一视频的词袋向量v建模为可见单元并作为主题模型的输入,将相应视频的主题描述子c建模为隐含单元并作为所述主题模型的输出,得到主题模型;步骤S5,将所述视频训练集随机划分为多个子集,对于每一个子集分别计算所述主题模型的目标函数中的对数似然项和稀疏正则项对于可见单元的偏置参数a、隐含单元的偏置参数b和连接可见单元与隐含单元的权值W的梯度;步骤S6,随机初始化偏置参数a、b和权值W的值,根据所述对数似然项和稀疏正则项对于偏置参数a、b和权值W的梯度,利用随机梯度下降法对偏置参数a、b和权值W分别进行更新直到所述主题模型的目标函数收敛到给定最小值或达到迭代停止条件,最后得到一个有稀疏约束的非负无向主题模型;步骤S7,根据所述步骤S2和S3提取得到所述视频测试集中测试视频的词袋向量,并将所述测试视频和所述训练视频的词袋向量一并输入到所述步骤S6得到的有稀疏约束的非负无向主题模型中,利用隐含单元对可见单元的条件概率分别推断得到所述测试视频和训练视频的主题描述子;步骤S8,分别计算所述测试视频的主题描述子与所述视频训练集中每一个训练视频的主题描述子之间的余弦距离,并根据所述余弦距离进行视频检索,得到与所述测试视频相似的视频。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310255896.3/,转载请声明来源钻瓜专利网。