[发明专利]音频指纹提取方法、服务器、存储介质在审

专利信息
申请号: 202010886612.0 申请日: 2020-08-28
公开(公告)号: CN112037815A 公开(公告)日: 2020-12-04
发明(设计)人: 郑攀峰;褚亮亮;陈军 申请(专利权)人: 中移(杭州)信息技术有限公司;中国移动通信集团有限公司
主分类号: G10L25/03 分类号: G10L25/03;G10L25/18;G10L19/02
代理公司: 上海晨皓知识产权代理事务所(普通合伙) 31260 代理人: 成丽杰
地址: 310011 浙江省杭州*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 音频 指纹 提取 方法 服务器 存储 介质
【说明书】:

发明实施例涉及音频领域,公开了一种音频指纹提取方法、服务器、存储介质。本发明中,获取音频序列;根据所述音频序列生成频谱图;选取所述频谱图中稳定的极值点作为特征点;取所述特征点的相关极值点作为所述特征点的描述子;通过变换所述描述子修正偏移的所述特征点;将修正后的所述特征点作为所述音频序列的特征;可以在音频失真的情况下也能提取到具有较高精确度的特征。

技术领域

本发明实施例涉及音频领域,特别涉及音频指纹提取方法、服务器、存储介质。

背景技术

本发明涉及音频指纹提取技术,音频指纹提取技术是通过特定的算法将一段音频中独一无二的数字特征以标识符的形式提取出来,用于识别海量的声音样本或跟踪定位样本在数据库中的位置。本技术可以适用在声音文件的识别、检索和相似性比对,流媒体广告监播,音乐版权保护,声纹密码识别等多种领域。

然而,目前成熟的算法对经过拷贝、传输和转码后的音频指纹提取效果比较好。但是,音频在一定失真情况下,例如,音频是现场录制的或经过变速、变调处理以后,音频指纹技术所提取出来的特征在识别准确性上会大大降低。

发明内容

本发明实施方式的目的在于提供一种音频指纹提取方法、服务器、存储介质,使得可以在音频失真的情况下也能提取到具有较高精确度的特征。

为解决上述技术问题,本发明的实施方式提供了一种音频提取方法,包括以下步骤:

获取音频序列;

根据所述音频序列生成频谱图;

选取所述频谱图中稳定的极值点作为特征点;

取所述特征点的相关极值点作为所述特征点的描述子;

通过变换所述描述子修正偏移的所述特征点;

将修正后的所述特征点作为所述音频序列的特征。

本发明的实施方式还提供了一种服务器,包括:

至少一个处理器;以及,

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行音频指纹提取方法。

本发明实施方式相对于现有技术而言,通过利用许多极值点作为一个特征点的描述子的方式,区别于现有技术的只将一个极值点作为特征的方式,由于使用了较多的数据,使得到的数据稳定性更高,避免了由于变速,变调等音频失真的情况下,音频特征提取的不够准确,也避免了在后续的特征利用,如音频比对、检索中造成较大误差。

另外,本发明实施方式提供的音频指纹提取方法,所述选取所述频谱图中稳定的点作为特征点,包括:对所述频谱图进行对数Log映射;生成具有所述稳定极值点的所述频谱图。选取一定长度的帧长使生成的频谱图比较稳定,使极值点的位置表动较小;由于音频经过变调会拉伸频谱,频率会按倍数关系变化,经过映射到log域之后,倍数变化就变成了常数位移,使频谱图中选取为特征点的极值点更加准确和稳定。

另外,本发明实施方式提供的音频指纹提取方法,在所述对所述频谱图进行对数Log映射前,还包括:对所述频谱图做10x10的二维高斯滤波。频谱图在未经处理时会包含许多低能量细节信息,通过二维高斯滤波过滤掉这些细节信息,使频谱图中稳定的极值点更加的突出。

另外,本发明实施方式提供的音频指纹提取方法,在所述对所述频谱图进行对数Log映射后,还包括:对所述映射后的所述频谱图做水平方向和竖直方向的高斯滤波。水平方向的高斯滤波可以突出音频中的变化强烈的部分而减弱变化缓慢的部分;竖直方向的高斯滤波可以起到一定的去噪声效果。通过水平方向和竖直方向的高斯滤波使得极值点更稳定,选取的特征点更准确。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中移(杭州)信息技术有限公司;中国移动通信集团有限公司,未经中移(杭州)信息技术有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010886612.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top