[发明专利]一种基于二级倒排表的树状音频特征索引库建立方法在审
申请号: | 201810455198.0 | 申请日: | 2018-05-14 |
公开(公告)号: | CN108664622A | 公开(公告)日: | 2018-10-16 |
发明(设计)人: | 张卫强;袁庆升;刘艺;包秀国;张鸿;汪立东;杜翠兰;刘洋;刘加 | 申请(专利权)人: | 国家计算机网络与信息安全管理中心;清华大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京众合诚成知识产权代理有限公司 11246 | 代理人: | 张文宝 |
地址: | 100029*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 索引库建立 音频特征 倒排表 量化 残差 数字集成电路芯片 音频数据库 矢量量化 分段 | ||
本发明公开了一种基于二级倒排表的树状音频特征索引库建立方法,所述音频特征索引库建立方法在数字集成电路芯片中进行以下步骤:步骤1:对音频数据库中的所有特征分段进行粗量化;步骤2:对步骤1中的粗量化残差进行二级粗量化;步骤3:对粗量化残差进行乘积矢量量化;步骤4:插入倒排表。
技术领域
本发明涉及音频信号处理技术领域,特别是涉及基于二级倒排表的超大规模树状音频特征索引库建立方法。
背景技术
音频检索是音频信号处理领域的一项基本操作,对于小规模的音频检索问题,可以遍历查找即可获得很好检索结果;但是对于超大规模音频而言,需要检索的音频数据库是海量规模,数据库内的音频颗粒数量巨大,将待查找音频与数据所有的内容比较将花费大量时间,在实际应用中不可承受。
因此希望有一种基于二级倒排表的超大规模树状音频特征索引库建立方法,以解决现有技术中存在的问题。
发明内容
本发明的目的在于提供一种基于二级倒排表的超大规模树状音频特征索引库建立方法,对于每一个待查找音频颗粒,索引库直接给出其近邻可能出现的入口,系统只要通过这些入口来查找数据库中已有的音频特征。
所述音频特征索引库建立方法在数字集成电路芯片中进行以下步骤:
步骤1:对音频数据库中的所有特征分段进行粗量化;
步骤2:对步骤1中的粗量化残差进行二级粗量化;
步骤3:对粗量化残差进行乘积矢量量化;
步骤4:插入倒排表。
优选地,所述步骤1对所述音频数据库中的所有特征分段,每4帧组成一个音频颗粒,对音频颗粒矢量量化以进行所述粗量化。
优选地,所述步骤1通过对所述音频数据库中的每个特征颗粒y进行所述粗量化得到粗量化编码和所述粗量化残差,粗量化编码是指与y最近邻的码本编号,所述粗量化残差是指y与最近邻码本的差值。
优选地所述步骤1中按所述粗量化形成的树状结构建立倒排表以形成一级倒排表,粗量化码本数量等于一级倒排表入口的个数。
优选的,为了再次减小需要搜索的音频颗粒数量,所述步骤2使用矢量量化对所述步骤1的所述粗量化残差进行所述二级粗量化,得到二级粗量化编码。
优选的,所述步骤3中粗量化残差的维数与所述音频颗粒y的维数相同,对所有音频颗粒对应的残差分成4组,采用乘积矢量量化,每组量化为1字节,每个音频颗粒对应的所述乘积矢量量化结果为4字节。
优选的,所述步骤4假设所述音频颗粒y对应的粗量化编码为i1,二级粗量化编码为i2,所述每个音频颗粒对应的乘积矢量量化得到的4字节码字对应的唯一标识为ID,将ID与所述粗量化残差组成的二元组插入到第i1个倒排索引的第i2个入口中。
优选的,所述音频特征索引库建立方法在数字集成电路芯片中还包括步骤5:保存所述步骤1中的粗量化编码和所述步骤2中的二级粗量化编码。
针对超大规模音频检索问题,本发明提出基于二级倒排表的超大规模树状音频特征索引库建立方法。音频特征经过量化后,每个一级倒排表入口对应的是一系列二级倒排表入口,二级倒排表才对应到实际的音频颗粒索引。通过多层次的倒排表查找,需要比对的索引数量呈指数下降,大大提高了检索的速度。同时,由于多级倒排表是按照树状规则构建的,虽然比对的索引数量大大减少了,但是待检索颗粒真正的近邻仍有极大可能落在这个多级倒排表入口中,从而保证了检索的精度。
附图说明
图1是基于二级倒排表的超大规模树状音频特征索引库建立方法的流程图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心;清华大学,未经国家计算机网络与信息安全管理中心;清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810455198.0/2.html,转载请声明来源钻瓜专利网。