[发明专利]一种基于音频指纹的听歌识曲方法、系统及音频设备有效
申请号: | 201911229948.3 | 申请日: | 2019-12-04 |
公开(公告)号: | CN111161758B | 公开(公告)日: | 2023-03-31 |
发明(设计)人: | 曾志先;肖龙源;李稀敏;蔡振华;刘晓葳 | 申请(专利权)人: | 厦门快商通科技股份有限公司 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/54;G06F16/683;G06F16/61 |
代理公司: | 厦门仕诚联合知识产权代理事务所(普通合伙) 35227 | 代理人: | 乐珠秀 |
地址: | 361009 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 音频 指纹 听歌识曲 方法 系统 音频设备 | ||
1.一种基于音频指纹的听歌识曲方法,其特征在于,包括以下步骤:
收集歌曲音频作为模板音频,并获取所述模板音频对应的频谱图,从所述频谱图中提取峰值点作为所述模板音频对应的模板音频指纹,根据所述模板音频和所述模板音频指纹进行构建歌曲音频的模板音频指纹数据库;
获取当前音乐的录制音频,并获取所述录制音频对应的频谱图,从所述频谱图中提取峰值点作为所述录制音频对应的录制音频指纹;
将所述录制音频指纹与所述模板音频指纹数据库中的模板音频指纹进行匹配;
若匹配度达到设定的阈值,则输出所述录制音频对应匹配的歌曲音频;
其中,将所述录制音频指纹与所述模板音频指纹数据库中的模板音频指纹进行匹配,包括以下匹配步骤:
对所述录制音频指纹对应的频谱图中的峰值点和/或所述模板音频指纹对应的频谱图中的峰值点进行分组,得到峰值点组合,并计算每个峰值点组合对应的哈希值:所述峰值点组合包括5个峰值点和一个锚点,所述锚点的频率小于或等于所述峰值点的频率,所述锚点用于获取所述峰值点组合中的每个峰值点相对所述锚点的时间差;根据所述峰值点的频率值、所述锚点的频率值、所述峰值点与所述锚点之间的时间差进行创建所述峰值点对应的三维数组;计算所述三维数组的哈希值,作为所述峰值点的哈希值;
对所述当前音乐的录制音频指纹和所述模板音频指纹数据库中的模板音频指纹分别建立对应的音频指纹哈希表;所述音频指纹哈希表包括所述录制音频指纹或所述模板音频指纹所包含每个峰值点的哈希值、每个峰值点所属的音频ID、每个峰值点所属的峰值点组合的对应的锚点的时间位置;
计算所述录制音频的音频指纹哈希表中的峰值点哈希值在所述模板音频的音频指纹哈希表中出现的频次;
判断所述频次是否大于预设阈值,若是,则输出所述录制音频对应匹配的歌曲音频。
2.根据权利要求1所述的基于音频指纹的听歌识曲方法,其特征在于:根据所述哈希值进行音频指纹的匹配,是通过对所述峰值点组合中的每个峰值点的哈希值进行匹配实现音频指纹的匹配;或者,是根据每个峰值点的哈希值计算所述峰值点组合的总和哈希值,通过对所述峰值点组合的总和哈希值进行匹配实现音频指纹的匹配;或者,是根据每个峰值点的哈希值计算最大哈希值,将该最大哈希值作为所述峰值点组合的代表哈希值,通过对所述峰值点组合的代表哈希值进行匹配实现音频指纹的匹配。
3.根据权利要求1所述的基于音频指纹的听歌识曲方法,其特征在于:将所述录制音频指纹与所述模板音频指纹数据库中的模板音频指纹进行匹配,进一步包括以下匹配步骤:
从所述模板音频指纹数据库中提取任一模板音频指纹,对所述当前音乐的录制音频指纹和所述模板音频指纹数据库中的模板音频指纹分别建立对应的音频指纹哈希表;
根据所述音频指纹哈希表确定所述任一模板音频指纹与所述当前音乐的录制音频指纹的相似度;
若所述相似度小于设定相似度阈值,提取所述任一模板音频指纹的下一模板音频指纹,并判断该下一模板音频指纹与所述当前音乐的录制音频指纹的相似度,如此循环;
判断是否存在与所述当前音乐的录制音频指纹的相似度大于设定相似度阈值的模板音频指纹,若存在,则输出所述录制音频对应匹配的歌曲音频。
4.根据权利要求1至3任一项所述的基于音频指纹的听歌识曲方法,其特征在于:所述模板音频指纹数据库采用Redis内存存储方式,将哈希值作为键,将该哈希值所属的模板音频作为值,存储在Redis数据库中;并且,采用散列的方式将所述音频指纹分布存储在一个以上的Redis数据库中。
5.根据权利要求1至3任一项所述的基于音频指纹的听歌识曲方法,其特征在于:获取频谱图之前,还包括对所述模板音频或所述录制音频进行转码,将二进制数据文件转换为音频波形文件,并且采用在内存中进行转码的方式;然后将所述音频波形文件进行傅里叶变换的处理,得到对应的频谱图。
6.根据权利要求1至3任一项所述的基于音频指纹的听歌识曲方法,其特征在于:获取所述录制音频的频谱图之前,当所述录制音频的时长大于预设时长阈值时,还包括对所述录制音频进行分段处理,并选取其中一段进行匹配;若匹配失败再选取其中另一段进行匹配,直至得到最终匹配结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门快商通科技股份有限公司,未经厦门快商通科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911229948.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种散热效果好的入侵防御终端
- 下一篇:一种处理未读消息的方法及终端设备