[发明专利]一种深度学习和哈希编码的视频检索方法有效
申请号: | 201811632349.1 | 申请日: | 2018-12-29 |
公开(公告)号: | CN109783691B | 公开(公告)日: | 2022-06-21 |
发明(设计)人: | 孔彦;伭剑辉;赵玉军;王黎明 | 申请(专利权)人: | 北京远鉴信息技术有限公司 |
主分类号: | G06F16/783 | 分类号: | G06F16/783;G06F16/732;G06K9/62 |
代理公司: | 北京中海智圣知识产权代理有限公司 11282 | 代理人: | 杨树芬 |
地址: | 100142 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种深度学习和哈希编码的视频检索方法,其特征在于,使用同一种特征进行镜头分割和特征提取;在视频检索中,镜头分割把相同镜头的视频帧作为冗余帧处理以降低计算量并提升检索效率,将镜头特征提取算法得到的特征作为镜头切分的依据以解决同一镜头内不同帧的特征存在差异的问题。本发明所述方法的优越效果是能够实现镜头级别的视频检索并能提高检索的准确率;在视频检索能力方面的视频镜头检索准确率达95%以上,采用了纯二值操作,速度能够提升4倍。 | ||
搜索关键词: | 一种 深度 学习 编码 视频 检索 方法 | ||
【主权项】:
1.一种深度学习和哈希编码的视频检索方法,其特征在于,包括以下步骤:步骤1、将视频文件解码成视频帧;步骤2、基于深度学习提取视频帧特征,将卷积神经网络CNN的卷积层输出特征作为图像检索的图像特征向量来使用;步骤3、通过特征哈希方法将浮点特征映射为二值特征;步骤4、采用多比特哈希编码方法,将哈希空间中的浮点向量量化为二值向量,转换为二值特征描述子能够降低特征存储的空间开销并提升特征比对速度;步骤5、计算每个相邻帧哈希特征的相似性,相似性高的合并为同一镜头;步骤6、将分割好镜头的视频哈希特征作为视频的特征描述。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京远鉴信息技术有限公司,未经北京远鉴信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811632349.1/,转载请声明来源钻瓜专利网。