[发明专利]一种相似视频检索方法、装置、系统及存储介质在审
| 申请号: | 202310264668.6 | 申请日: | 2023-03-12 |
| 公开(公告)号: | CN116226442A | 公开(公告)日: | 2023-06-06 |
| 发明(设计)人: | 谷扬 | 申请(专利权)人: | 天翼云科技有限公司 |
| 主分类号: | G06F16/732 | 分类号: | G06F16/732;G06N3/0895;G06N3/084;G06V10/74;G06V10/82;G06N3/0464 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 100010 北京市东城区青*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 相似 视频 检索 方法 装置 系统 存储 介质 | ||
1.一种相似视频检索方法,其特征在于,包括以下步骤:
S1、获取视频图像数据集并根据常见编辑方法生成图像对;
S2、将图像对输入卷积神经网络中训练,计算中间特征和哈希层的对比损失,用随机梯度下降法优化损失,直至收敛;
S3、对视频库中的每个视频进行编号;
S4、根据相似度检索相似视频。
2.如权利要求1所述相似视频检索方法,其特征在于:所述S1生成图像对的具体步骤包括:
S11、根据存放在变换工具中的常见编辑方法对训练图像样本集中的样本进行处理;
S12、将原图与处理后的图两两作为图像对。
3.如权利要求2所述相似视频检索方法,其特征在于:所述常见编辑方法包括尺寸变化,截取和拼接。
4.如权利要求1所述相似视频检索方法,其特征在于:所述S2具体包括以下步骤:
S21、对输入卷积神经网络中的数据对提取特征向量对embeddiing1和embedding2;
S22、使用损失函数得到特征向量对并记为Lossemb;
S23、对特征向量对进行处理得到局部特征紧凑图像表征embeddiing1.1和embedding2.1;
S24、对局部特征紧凑图像表征embeddiing1.1和embedding2.1进行哈希处理得到hash1和hash2,哈希码对损失记为Losshash;
S25、将总损失记为Loss=Lossemb+Losshash,误差口模型反向传播并更新参数;
S26、重复S21-S25,直至网络收敛。
5.如权利要求1所述相似视频检索方法,其特征在于:所述S3具体包括以下步骤:
S31、将数据库中的多个视频分帧成多张图片{frame1,frame2...};
S32、将S31中的多张图片输入到训练好的卷积神经网络中得到该视频的每帧图像的短哈希码矩阵G=[hash1,hash2...];
S33、对生成的短哈希码组作为特征矩阵索引保存在数据库中,并对每个视频进行编号。
6.如权利要求1所述相似视频检索方法,其特征在于:所述S4通过相似度检索相似视频的具体步骤包括:
S41、将待查询视频分帧成若干张图像并输入到卷积神经网络中生成每帧的短哈希码;
S42、计算查询视频每帧和现有视频数据库中哈希码矩阵的相似度,取相似度最高的分数保存;
S43、统计最终排序,计算相似度,并根据相似度得到检索结果。
7.如权利要求6所述相似视频检索方法,其特征在于:所述S43中计算相似度的计算方式为:
其中,s相似度,m*α为长度阈值,θ为相似度阈值,m为待查询视频分帧的图像数,qiscore为相似度最高的分数。
8.一种相似视频检索装置,其特征在于,包括图像对生成模块,训练模块,编号模块和检索模块,其中:
图像对生成模块,用于获取视频图像数据集并根据常见编辑方法生成图像对;
训练模块,用于将图像对输入卷积神经网络中训练,计算中间特征和哈希层的对比损失,用随机梯度下降法优化损失,直至收敛;
编号模块,用于对视频库中的每个视频进行编号;
检索模块,用于根据相似度检索相似视频。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天翼云科技有限公司,未经天翼云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310264668.6/1.html,转载请声明来源钻瓜专利网。





