[发明专利]一种基于M-tree的音频检索方法无效
申请号: | 201310219429.5 | 申请日: | 2013-06-03 |
公开(公告)号: | CN103324691A | 公开(公告)日: | 2013-09-25 |
发明(设计)人: | 严勤;徐淮杰;陶秋雨;印晶晶;胡棚 | 申请(专利权)人: | 河海大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 杨楠 |
地址: | 210098 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 tree 音频 检索 方法 | ||
技术领域
本发明涉及一种音频检索方法,尤其涉及一种基于M-tree的音频检索方法,属于音频检索技术领域。
背景技术
面向音频的相似度检索方法,是基于内容的音乐检索以及音乐推荐领域的一个重要分支,具体是指通过使用音频的特征找出与其相似音频的方法。常见的音乐检索系统中,常用基于语义词汇的特征向量来表征音乐,进而使用相关算法计算两首歌曲的距离(相似度)。因此,找出音乐关联度很强的语义词汇以及合适的相似度算法成为研究的重点。
在音乐检索系统中,系统的响应速度与检索效率有非常密切地关系。目前的研究很多是基于降维的技术。如有的研究使用奇异值分解技术将特征矩阵映射到低维空间再进行推荐。该方法有效减少了在线计算所需要的时间,但是需要离线计算量非常大。也有的研究使用音乐指纹来表征音乐,存储在数据库中,方便音乐检索时进行比对。这两类方法都建立在压缩音乐信息的基础之上,因而会直接影响到音乐相似度检索的效果。多媒体系统中常使用高维数据索引解决检索效率问题。但是常见的高维索引结构如R-Tree等在维度高于20时性能会急剧下降。另外由于这些索引结构都将高维向量作为高维空间中的一个点,无法根据需要使用合适的距离度量函数,会对检索的效果构成影响。因此,寻找一款合适的索引结构也是音乐检索技术实现应用的关键。
发明内容
本发明所要解决的技术问题在于克服现有音频检索方法的不足,提供一种基于M-tree的音频检索方法,利用主成分分析方法对音频语义特征进行降维,并构建M-tree高维索引结构,能有效提高音频检索的效率和准确率。
本发明具体采用以下技术方案:
一种基于M-tree的音频检索方法,包括以下步骤:
步骤A、提取音频数据集中各音频数据的高层语义特征,并利用主成分分析法对所提取的高层语义特征进行降维,得到表征音频数据集中各音频数据的语义特征向量;
步骤B、以步骤A中得到的音频数据集中所有音频数据的语义特征向量的集合作为数据集,并根据语义特征向量之间的相似度构建M-tree数据索引结构,其中任意两个语义特征向量d1、d2之间的相似度sim(d1,d2)按照以下公式计算:
式中,d1·d2表示两个向量d1、d2的内积,|d1|、|d2|分别表示向量d1、d2的长度;
步骤C、按照步骤A中的方法获取查询对象的语义特征向量,利用最近邻检索算法从步骤B所构建的M-tree数据索引结构中找出与查询对象的语义特征向量最相近的前k个语义特征向量,k为自然数,这k个语义特征向量所对应的音频数据即为最终的音频检索结果。
相比现有技术,本发明具有以下有益效果:
(1)本发明将M-tree数据索引结构引入音频检索中,并采用余弦角度作为数据之间的距离(相似度)度量函数,大幅提高了音频检索的准确率和效率;
(2)本发明采用主成分分析方法对音频语义特征进行降维,进一步提高了音频检索的检索效率。
附图说明
图1为M-tree数据索引结构的构建流程示意图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310219429.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于共生稀疏直方图的图像检索方法
- 下一篇:一种数字编码汉字输入法