[发明专利]音视频内容检索方法及系统有效

专利信息
申请号: 201210046176.1 申请日: 2012-02-27
公开(公告)号: CN103294696B 公开(公告)日: 2018-01-19
发明(设计)人: 张峰;黄伟 申请(专利权)人: 上海果壳电子有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京辰权知识产权代理有限公司11619 代理人: 张斯盾
地址: 201203 上海市*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 视频 内容 检索 方法 系统
【说明书】:

技术领域

本发明涉及内容检索技术领域,尤其涉及一种音视频内容检索方法及系统。

背景技术

随着网络和多媒体技术的迅猛发展,音视频媒体的数量呈爆炸性增长,人们对数字音视频内容进行准确有效地管理和访问变得十分困难。近年来,基于内容的音视频检索出现了许多新的研究和发展方向,音视频指纹技术应运而生。

音频指纹(audio fingerprinting)技术在很早以前就被提出,例如,Jaap Haitsma和Ton Kalke在2002年音乐搜索进展国际会议上发表了“一种高可靠性的音频指纹系统”(A Highly Robust Audio Fingerprinting System),这种系统通过信号处理的方法,将音频文件中每隔一段时间(例如11.6ms)的音频信号,转化为一个32比特(bit)大小的指纹(fingerprint),通过这种方法一个音频文件就可以被转换为一个指纹文件,系统在对所有的音频指纹文件做索引后,就可以快速的音频指纹检索了。

与音频指纹技术原理相似,视频指纹(video fingerprinting)系统将每一帧或者几帧转化为很小的指纹(例如32比特大小),然后进行检索。例如国际专利号为WO2007/127590A2的“Method and system for fingerprinting digital video object based on multiresolution,multirat and temporal signatures”公开了一种将视频信号的每帧转化为84比特或132比特的视频指纹处理方法,通过这种方法一个视频文件就可以被转换成一个很小的指纹文件。

目前,音视频指纹技术成为音视频检索的关键技术之一,现有的音视频指纹系统通常是先对输入的音视频进行指纹特征提取,然后按照指纹特征的帧序,按顺序在指纹数据库中进行倒排索引的检索,以快速高效的识别和检索出音视频内容。

然而,现有的音视频指纹系统中,音视频的码率、格式和噪声干扰会导致指纹特征变形,进而影响检索性能。

发明内容

本发明的目的在于提供一种音视频内容检索方法,在基于音视频指纹进行音视内容检索时,能根据指纹的先验容错度进行音视频片段的选择,提高音视频检索的识别率。

为解决上述问题,本发明提供一种音视频内容检索方法,包括:

接收一音视频片段;

提取该音视频片段每一帧的指纹特征,获得一输入指纹序列;

计算所述输入指纹序列中每帧指纹的抗干扰程度;

对所述输入指纹序列中的每帧指纹,在包含该帧指纹在内的连续若干帧指纹中选出抗干扰能力最强的多个非连续帧指纹作为该帧指纹的待匹配指纹块;

依次对所述输入指纹序列中的每帧指纹,查询出该帧指纹在一标准指纹数据库中的位置,并计算该帧指纹所在的待匹配指纹块与标准指纹块的差异程度,当某帧指纹的差异程度小于预设值时,检索到所述音视频片段匹配的音视频内容。

进一步地,提取该音视频片段每一帧的指纹特征的步骤包括:

首先,对于固定采样率的单声道音视频,按固定帧移,将音视频分成若干毫秒的帧,加汉明窗;

然后,对每一帧做傅立叶变换,提取功率谱,将功率谱中某段频带采用对数刻度均匀分为互不相交的33个子带,并计算每一帧的子带能量;

接着,计算同一帧内相邻两子带能量差分和相邻两帧同一子带的能量差分,得到每一帧指纹特征值。

进一步地,计算所述输入指纹序列中每帧指纹的抗干扰程度的公式为:Roubust(n)=ABS(E(n,m)-E(n,m+1)-(E(n-1,m)-E(n-1,m+1))),

其中Robust(n)表示第n帧指纹的抗干扰程度,E(n,m)表示第n帧的第m个子带的能量。

进一步地,计算所述输入指纹序列中每帧指纹的抗干扰程度的公式为:

其中Robust(n)表示第n帧指纹的抗干扰程度,

E_frame_sor=sortm=1,32(ABS(E(n,m)-E(n,m+1)-(E(n-1,m)-E(n-1,m+1))))

E(n,m)表示第n帧的第m个子带的能量,sort()表示排序。

进一步地,每一帧指纹的抗干扰程度通过频谱值或色彩值来计算获得。

进一步地,所述差异程度用比特位错误率BER(Bit Error Rate)表示,其计算公式如下:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海果壳电子有限公司,未经上海果壳电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210046176.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top