[发明专利]一种音频模板提取方法及装置在审
申请号: | 201810536337.2 | 申请日: | 2018-05-29 |
公开(公告)号: | CN108763492A | 公开(公告)日: | 2018-11-06 |
发明(设计)人: | 邓菁;王黎明 | 申请(专利权)人: | 四川远鉴科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G10L25/03;G10L25/51 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 徐丽 |
地址: | 615000 四川省凉山彝*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频指纹 匹配音频 音频模板 音频数据 聚类 标识符 哈希表 相似度 标识提供 音频片段 重复出现 预设 搜索 分类 帮助 | ||
本发明实施例提供一种音频模板提取方法及装置。所述方法包括获取多个音频数据并提取对应的音频指纹,根据音频指纹建立音频指纹哈希表;根据音频指纹哈希表计算任意两个音频指纹的相似度,获取相似度大于预设阈值的两个音频指纹对应的匹配音频片段;对匹配音频片段建立标识符,根据标识符通过聚类准则将匹配音频片段进行聚类,根据聚类后标识符对聚类后音频数据进行切分获得音频模板。装置用于执行所述方法。本发明实施例通过根据音频数据对应的音频指纹建立音频指纹哈希表并获取对应的匹配音频片段,根据匹配音频片段进行聚类获得音频模板,能够从海量音频数据中找出重复出现的音频片段作为音频模板,为音频数据的搜索、分类、标识提供帮助。
技术领域
本发明涉及音频处理技术领域,具体而言,涉及一种音频模板提取方法及装置。
背景技术
音频指纹技术(Audio fingerprinting technology)是指通过特定的算法将一段音频数据中独一无二的数字特征以标识符的形式提取出来,跟音频模版库中的音频指纹进行比对,以便确定出现了哪一个音频模版以及出现的位置。
在音频指纹领域,音频模版都是通过事先标注好的,从这些音频模版中提取音频指纹构建音频模版数据库。在搜索过程中,将待搜索音频数据中提取的音频指纹与音频模版库中的音频指纹进行相似度计算,从而找出待搜索音频数据中出现的音频模版。音频指纹作为音频内容自动识别技术的核心算法,已广泛应用于广告监播,音乐识别,版权内容监播,内容库去重和电视第二屏互动等领域。
但是,现有技术中用于建立音频模版的音频数据都是已经存在的,如音乐、广告音频、节目音频流等。对于一些事先没有音频模版数据的应用领域,则无法实现从海量音频数据中提取到所需的音频模板。
发明内容
有鉴于此,本发明实施例的目的在于提供一种音频模板提取方法及装置,以解决上述技术问题。
第一方面,本发明实施例提供了一种音频模板提取方法,包括:
获取多个音频数据,并提取各所述音频数据对应的音频指纹,根据各所述音频指纹建立对应的音频指纹哈希表;
根据所述音频指纹哈希表计算任意两个所述音频指纹的相似度,获取所述相似度大于预设阈值的两个音频指纹对应的匹配音频片段;
对所述匹配音频片段建立标识符,根据所述标识符通过聚类准则将所述匹配音频片段进行聚类,根据聚类后标识符对相应的聚类后音频数据进行切分,获得音频模板。
进一步地,所述获取多个音频数据,并提取各所述音频数据对应的音频指纹,根据所述音频指纹建立音频指纹哈希表,包括:
获取所述多个音频数据;
对获取到的所述音频数据按照预设帧长和预设帧移进行分帧处理;
将每一帧的音频数据从时域信号变换为频域信号,获得每一频点对应的幅度值;
将所述音频数据对应的频域空间划分为多个子空间,根据所述幅度值计算每一子空间中的幅度极值;
根据每一子空间中的所述幅度极值获得对应的所述音频数据的音频指纹,并记录所述幅度极值对应的帧序号;
根据所述音频指纹和所述帧序号建立对应的所述音频指纹哈希表。
进一步地,所述根据所述音频指纹哈希表计算任意两个所述音频指纹的相似度,获取所述相似度大于预设阈值的两个音频指纹对应的匹配音频片段,包括:
获取所述每一音频指纹对应所述音频指纹哈希表,所述音频指纹哈希表包括帧序号;
任意获取两个所述音频指纹哈希表中相同的所述音频指纹分别对应的所述帧序号,并将所述帧序号之间的差值作为时间差;
根据所述时间差建立时间差哈希表;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川远鉴科技有限公司,未经四川远鉴科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810536337.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:图片处理方法、装置及终端设备
- 下一篇:一种基于深度学习的推荐方法