[发明专利]一种音频模板提取方法及装置在审
申请号: | 201810536337.2 | 申请日: | 2018-05-29 |
公开(公告)号: | CN108763492A | 公开(公告)日: | 2018-11-06 |
发明(设计)人: | 邓菁;王黎明 | 申请(专利权)人: | 四川远鉴科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G10L25/03;G10L25/51 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 徐丽 |
地址: | 615000 四川省凉山彝*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频指纹 匹配音频 音频模板 音频数据 聚类 标识符 哈希表 相似度 标识提供 音频片段 重复出现 预设 搜索 分类 帮助 | ||
1.一种音频模板提取方法,其特征在于,包括:
获取多个音频数据,并提取各所述音频数据对应的音频指纹,根据各所述音频指纹建立对应的音频指纹哈希表;
根据所述音频指纹哈希表计算任意两个所述音频指纹的相似度,获取所述相似度大于预设阈值的两个音频指纹对应的匹配音频片段;
对所述匹配音频片段建立标识符,根据所述标识符通过聚类准则将所述匹配音频片段进行聚类,根据聚类后标识符对相应的聚类后音频数据进行切分,获得音频模板。
2.根据权利要求1所述的方法,其特征在于,所述获取多个音频数据,并提取各所述音频数据对应的音频指纹,根据所述音频指纹建立音频指纹哈希表,包括:
获取所述多个音频数据;
对获取到的所述音频数据按照预设帧长和预设帧移进行分帧处理;
将每一帧的音频数据从时域信号变换为频域信号,获得每一频点对应的幅度值;
将所述音频数据对应的频域空间划分为多个子空间,根据所述幅度值计算每一子空间中的幅度极值;
根据每一子空间中的所述幅度极值获得对应的所述音频数据的音频指纹,并记录所述幅度极值对应的帧序号;
根据所述音频指纹和所述帧序号建立对应的所述音频指纹哈希表。
3.根据权利要求1所述的方法,其特征在于,所述根据所述音频指纹哈希表计算任意两个所述音频指纹的相似度,获取所述相似度大于预设阈值的两个音频指纹对应的匹配音频片段,包括:
获取所述每一音频指纹对应的所述音频指纹哈希表,所述音频指纹哈希表包括帧序号;
任意获取两个所述音频指纹哈希表中相同的所述音频指纹分别对应的所述帧序号,并将所述帧序号之间的差值作为时间差;
根据所述时间差建立时间差哈希表;
根据所述时间差哈希表计算对应的所述音频指纹的相似度;
获取所述相似度大于预设阈值的两个音频指纹对应的所述匹配音频片段,并记录所述匹配音频片段对应的起始帧序号、结束帧序号和匹配长度。
4.根据权利要求1任一项所述的方法,其特征在于,所述对所述匹配音频片段建立标识符,根据所述标识符通过聚类准则将所述匹配音频片段进行聚类,包括:
获取所述匹配音频片段;
分别为每一所述匹配音频片段对应的所述音频数据分配一个标识符,所述标识符包括音频文件ID、起始帧序号、结束帧序号;
根据所述音频文件ID、所述起始帧序号和所述结束帧序号对所述匹配音频片段进行聚类,获得聚类后标识符。
5.根据权利要求4所述的方法,其特征在于,所述根据聚类后的所述匹配音频片段对应的所述类别标识对相应的所述音频数据进行切分,获得音频模板,包括:
根据所述聚类后标识符获取对应的聚类后音频数据,并对所述聚类后音频数据按照所述起始帧序号和所述结束帧序号进行切分,获得所述音频模板。
6.根据权利要求4所述的方法,其特征在于,所述根据所述音频文件ID、所述起始帧序号和所述结束帧序号对所述匹配音频片段进行聚类,获得聚类后标识符,包括:
获取待聚类的第一匹配音频片段和第二匹配音频片段,所述第一匹配音频片段包括第一标识符、第一音频文件ID、第一起始帧序号、第一结束帧序号和第一相似度,所述第二匹配音频片段包括第二标识符、第二音频文件ID、第二起始帧序号、第二结束帧序号和第二相似度;所述第一起始帧序号与所述第一结束帧序号构成的第一区间,所述第二起始帧序号与所述第二结束帧序号构成的第二区间;
若判断获知所述第一音频文件ID与所述第二音频文件ID一致,且所述第一起始帧序号与所述第二起始帧序号一致,且所述第一结束帧序号与所述第二结束帧序号一致,则将所述第一匹配音频片段对应的标识符作为所述聚类后标识符;
若判断获知所述第一区间包含所述第二起始帧序号与所述第二区间,则将所述第一匹配音频片段对应的标识符作为所述聚类后标识符;
若判断获知所述第一区间与所述第二区间部分重叠,则生成新的标识符作为所述聚类后标识符;
若判断获知所述第一区间与所述第二区间不重叠,则将所述第一匹配音频片段对应的标识符和所述第二匹配音频片段对应的标识符均作为所述聚类后标识符。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川远鉴科技有限公司,未经四川远鉴科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810536337.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:图片处理方法、装置及终端设备
- 下一篇:一种基于深度学习的推荐方法