[发明专利]音频指纹提取方法、服务器、存储介质在审
申请号: | 202010886612.0 | 申请日: | 2020-08-28 |
公开(公告)号: | CN112037815A | 公开(公告)日: | 2020-12-04 |
发明(设计)人: | 郑攀峰;褚亮亮;陈军 | 申请(专利权)人: | 中移(杭州)信息技术有限公司;中国移动通信集团有限公司 |
主分类号: | G10L25/03 | 分类号: | G10L25/03;G10L25/18;G10L19/02 |
代理公司: | 上海晨皓知识产权代理事务所(普通合伙) 31260 | 代理人: | 成丽杰 |
地址: | 310011 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 指纹 提取 方法 服务器 存储 介质 | ||
1.一种音频指纹提取方法,其特征在于,包括:
获取音频序列;
根据所述音频序列生成频谱图;
选取所述频谱图中稳定的极值点作为特征点;
取所述特征点的相关极值点作为所述特征点的描述子;
通过变换所述描述子修正偏移的所述特征点;
将修正后的所述特征点作为所述音频序列的特征。
2.根据权利要求1所述的音频指纹提取方法,其特征在于,所述根据所述音频序列生成频谱图,包括:
对所述音频序列加汉宁窗来进行音频预处理;
将所述预处理后的所述音频序列进行分帧;
将所述分帧后的所述音频序列进行傅立叶变化;
根据所述傅立叶变化生成所述频谱图。
3.根据权利要求1所述的音频指纹提取方法,其特征在于,所述选取所述频谱图中稳定的点作为特征点,包括:
对所述频谱图进行对数Log映射;
生成具有所述稳定极值点的所述频谱图。
4.根据权利要求3所述的音频指纹提取方法,其特征在于,在所述对所述频谱图进行对数Log映射前,还包括:
对所述频谱图做10x10的二维高斯滤波。
5.根据权利要求3所述的音频指纹提取方法,其特征在于,在所述对所述频谱图进行对数Log映射后,还包括:
对所述映射后的所述频谱图做水平方向和竖直方向的高斯滤波。
6.根据权利要求1所述的音频指纹提取方法,其特征在于,所述取所述特征点的相关极值点作为所述特征点的描述子,包括:
划定所述频谱图中矩形区域作为所述特征点的描述子,其中,所述矩形区域中极值点包括所述特征点;
将所述矩形区域的频谱图进行均匀压缩。
7.根据权利要求1所述的音频指纹提取方法,其特征在于,所述通过变换所述描述子修正偏移的所述特征点,包括:
将矩形区域中的极值点进行移动,使所述特征点在所述矩形区域的中心;
将移动后的所述矩形区域的数据作为所述特征点的最终描述子。
8.根据权利要求1所述音频指纹提取方法,其特征在于,所述将修正后的所述特征点作为所述音频序列的特征,还包括:
对所述生成的音频序列的特征进行相关性打分。
9.一种服务器,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1-8任一所述的音频指纹提取方法。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的音频指纹提取方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中移(杭州)信息技术有限公司;中国移动通信集团有限公司,未经中移(杭州)信息技术有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010886612.0/1.html,转载请声明来源钻瓜专利网。