[发明专利]一种三级音频索引的创建方法及音频检索方法有效
申请号: | 201010177959.4 | 申请日: | 2010-05-20 |
公开(公告)号: | CN101833986A | 公开(公告)日: | 2010-09-15 |
发明(设计)人: | 郑贵滨;韩纪庆;郑铁然;姜涛;王勇;张慧;狄少嘉;唐健琪;丁丽 | 申请(专利权)人: | 哈尔滨工业大学;国家计算机网络与信息安全管理中心 |
主分类号: | G11B27/10 | 分类号: | G11B27/10 |
代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 张果瑞 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种三级音频索引的创建方法及音频检索方法,属于多媒体领域,为了解决现有技术针对大规模数据库和网络环境下的音频样例检索缺少快速、有效的索引机制的问题。本发明创建一种三级索引结构:对n维的音频特征向量降维,生成第一级索引;将第一级索引按单元长度截成一系列片段,计算其向量模,排序后作为第二级索引;计算片段的类别分,分组后作为第三级索引。基于三级索引的检索方法为:首先,计算出查询音频的一级索引值、片段向量模和类别分,然后依次利用第三级和第二级索引缩小查询范围,最后利用第一级索引计算查询音频与索引音频片段的相似度,将满足检出阈值的数据作为结果返回。 | ||
搜索关键词: | 一种 三级 音频 索引 创建 方法 检索 | ||
【主权项】:
一种三级音频索引的创建方法,其特征在于,该方法包括以下步骤:步骤一、对数据库中每个音频特征文件中的n维特征向量进行降维处理,生成一维的量化值,作为第一级索引;步骤二、将第一级索引数据按单元长度截成一系列片段,片段内的第一级索引值构成片段向量,计算每个片段向量的模ki,作为索引键值,以三元组形式描述片段向量,将所有片段三元组按键值排序则构成第二级索引;三元组包括索引键值ki、源文件id和片段向量在源文件中的位置i,步骤三、计算步骤二所述的每个片段的类别分,然后根据类别分将所有片段分组,作为第三级索引,即,类别索引。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学;国家计算机网络与信息安全管理中心,未经哈尔滨工业大学;国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201010177959.4/,转载请声明来源钻瓜专利网。
- 上一篇:掺铝氧化锌纳米粒子的制备方法
- 下一篇:一种法庭庭审视频实时标引方法