[发明专利]经由归一化对音频信号进行指纹识别的方法和装置在审
| 申请号: | 201980072112.9 | 申请日: | 2019-09-06 |
| 公开(公告)号: | CN113614828A | 公开(公告)日: | 2021-11-05 |
| 发明(设计)人: | R·库弗;Z·拉菲 | 申请(专利权)人: | 格雷斯诺特有限公司 |
| 主分类号: | G10L19/018 | 分类号: | G10L19/018;G10L19/025;G10L25/18 |
| 代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 王小东;黄纶伟 |
| 地址: | 美国加*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 经由 归一化 音频 信号 进行 指纹识别 方法 装置 | ||
1.一种用于音频指纹识别的装置,所述装置包括:
频率范围分离器,所述频率范围分离器将音频信号变换到频域,变换后的音频信号包括多个时间-频率仓,所述多个时间-频率仓包括第一时间-频率仓;
音频特性确定器,所述音频特性确定器确定所述多个时间-频率仓中的第一组时间-频率仓的第一特性,所述第一组时间-频率仓包围所述第一时间-频率仓;
信号归一化器,所述信号归一化器对所述音频信号进行归一化,从而生成归一化能量值,所述音频信号的归一化包括按所述第一特性对所述第一时间-频率仓进行归一化;
点选择器,所述点选择器选择所述归一化能量值中的一个归一化能量值;以及
指纹生成器,所述指纹生成器使用所述归一化能量值中的所选择的一个归一化能量值来生成所述音频信号的指纹。
2.根据权利要求1所述的装置,其中,所述频率范围分离器还执行所述音频信号的快速傅立叶变换。
3.根据权利要求1所述的装置,其中,所述点选择器还:
确定所述音频信号的类别;以及
按所述音频信号的所述类别对所述归一化能量值中的所述一个归一化能量值的选择进行加权。
4.根据权利要求3所述的装置,其中,所述音频信号的所述类别包括音乐、人类语音、音效或广告中的至少一项。
5.根据权利要求1所述的装置,其中,所述音频特性确定器还确定所述多个时间-频率仓中的第二组时间-频率仓的第二特性,所述第二组时间-频率仓包围所述多个时间-频率仓中的第二时间-频率仓,并且所述信号归一化器还按所述第一特性对所述第一时间-频率仓进行归一化。
6.根据权利要求1所述的装置,其中,所述点选择器基于所归一化的音频信号的能量极值来选择所述归一化能量值中的所述一个归一化能量值。
7.根据权利要求1所述的装置,其中,所述多个时间-频率仓中的各个时间-频率仓是以下项的唯一组合:(1)所述音频信号的时间段和(2)所述变换后的音频信号的频率仓。
8.一种用于音频指纹识别的方法,所述方法包括以下步骤:
将音频信号变换到频域,变换后的音频信号包括多个时间-频率仓,所述多个时间-频率仓包括第一时间-频率仓;
确定所述多个时间-频率仓中的第一组时间-频率仓的第一特性,所述第一组时间-频率仓包围所述第一时间-频率仓;
对所述音频信号进行归一化,从而生成归一化能量值,所述音频信号的归一化包括按所述第一特性对所述第一时间-频率仓进行归一化;
选择所述归一化能量值中的一个归一化能量值;以及
使用所述归一化能量值中的所选择的一个归一化能量值来生成所述音频信号的指纹。
9.根据权利要求8所述的方法,其中,将音频信号变换到频域的步骤包括执行所述音频信号的快速傅立叶变换。
10.根据权利要求8所述的方法,其中,选择所述归一化能量值中的一个归一化能量值的步骤包括:
确定所述音频信号的类别;以及
按所述音频信号的所述类别对所述归一化能量值中的所述一个归一化能量值的选择进行加权。
11.根据权利要求10所述的方法,其中,所述音频信号的所述类别包括音乐、人类语音、音效或广告中的至少一项。
12.根据权利要求8所述的方法,所述方法还包括:
确定所述多个时间-频率仓中的第二组时间-频率仓的第二特性,所述第二组时间-频率仓包围所述多个时间-频率仓中的第二时间-频率仓;以及
按所述第一特性对所述第一时间-频率仓进行归一化。
13.根据权利要求8所述的方法,其中,选择所述归一化能量值中的一个归一化能量值的步骤是基于所归一化的音频信号的能量极值进行的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于格雷斯诺特有限公司,未经格雷斯诺特有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980072112.9/1.html,转载请声明来源钻瓜专利网。





