[发明专利]辨识音频片段的方法及其装置在审

专利信息
申请号: 201610649485.6 申请日: 2016-08-10
公开(公告)号: CN107731244A 公开(公告)日: 2018-02-23
发明(设计)人: 雷永安;雷兆恒;余泳峰 申请(专利权)人: 天迈科技有限公司
主分类号: G10L25/51 分类号: G10L25/51
代理公司: 北京律诚同业知识产权代理有限公司11006 代理人: 黄韧敏,朱远平
地址: 中国香港九龙湾宏开道2*** 国省代码: 香港;81
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 辨识 音频 片段 方法 及其 装置
【说明书】:

技术领域

本发明涉及音乐识别技术领域,尤其涉及一种辨识音频片段的方法及其装置。

背景技术

在现有技术有不同的方法辨认音频片段,这种功能其中一个应用是当一个人在收声机、电视播放的一段音乐,听者对音乐好奇而想进一步知道关于这段音乐的名称及其它数据,现有技术包括在智能移动装置上运算的程序,以麦克风接收到音乐片段,以收集到的音乐进行分析,进一步将分析所得与自身的数据库比较而寻索到所述音乐片段的名称及其它数据。现有技术包括在iOS及Andriod上运算的音乐神搜(Shazam),其数据库是储存在云端服务器,而服务器储存了大部份的流行歌曲,使用者可以到商场、酒巴等启用智能移动装置上的程序,例如音乐神搜,以麦克风收取现场音乐,程序将音乐分析及转到服务器进行寻索,得出音乐片段发一首歌曲后在智能移动装置显示,程序可以进一步提议使用者可以在某一网站购买这首歌曲。

在现有技术还有一个专利技术,为中国专利,其申请号为CN 03808938.6,发明名称为:“坚固而且不变的音频图样匹配”,其提供一种用以快速并准确决定两个音频试样是否匹配、以及是否免于如为播放速度变动的各种变换的发明技术。两音频试样的间的关系的特征是首先匹配得自各别试样的某些指纹物件。对每个音频试样(210)产生一组(230)指纹物件(231、232),它们中的每一个发生在一特别位置(242)上。各位置(242)的决定依各音频试样(210)的内容而定,而且各指纹物件(232)在或接近各别特殊位置(242)处具备一或更多局部特性(222)。接着为每对匹配指纹物件决定相对值。然后产生一相对值的直方图。如发现一统计上的明显峰值,则两音频试样具备实质上匹配的特征。

上述专利的发明目的是准确决定两个音频是否匹配,其手段是由各自音频建立指纹。而音频指纹是指有特殊位置附近具备有一个或多个特性。基于这个发明的原理,现有技术包括对已知的音乐、歌曲等进行收采样办而进行摄取指纹,将这些音频指纹储存在一个数据库,当一个设置有麦克风的装置摄取新的音频时,立即利用所接收的音频进行摄取指纹,并以指纹到数据库中已储存指纹进行比较,找出新的音频最可以与数据库中的指纹相匹配的,就可以推理新的音频就是数据库中相联的音频,从而可以推论新的音频的数据,包括曲名、演唱者的名称等。

此外,分析音频片段,首先制成频谱图,所述频谱图如图1,横轴为时间(t),垂直轴为声音频率(f),而在某一(t,f)点的颜色代表在时间t频率f的音讯强度,而各种颜色以右边的颜色度作说明。这图较接近红色的为音量较大,也即在0.05秒到0.25秒时音量较大,而主要在2、3、5KHz左右。当这种图在单色的印刷品显示时,以较深色为音量较大。频谱图可有另一个表达方式,如图2,是以三维图显示,其中第一平面轴为时间,第二平面轴为声音频率,第三垂直轴为音讯强度(dB),三维立体图可以在单色的印刷品显示出来。

但是,该专利申请的技术方案中使用音谱峰值选取指纹部份,从而选取要采集数据点(参考该申请文件说明书3页指纹对象的说明),在选取指纹对象后采集其位置、变动成份和不变动成份。在分析一份音频时,所要分析比较的指纹点较多,因此其分析过程的所耗费的时间长,效率低。

综上可知,现有的辨识音频片段的技术在实际使用上,显然存在不便与缺陷,所以有必要加以改进。

发明内容

针对上述的缺陷,本发明的目的在于提供一种辨识音频片段的方法及其装置,以使音频片段的辨识操作更为简便,效率更高。

为了实现上述目的,本发明提供一种辨识音频片段的方法,所述方法包括如下步骤:

A、采集欲辨识的音频片段中达到预设时序序列长度的至少一条第一山脊线;

B、在将采集到的所述第一山脊线与预存的至少一条第二山脊线比对一致后,辨识出所述音频片段;

所述第一山脊线和第二山脊线均是由时间时序和音频频率组成的时间-音频坐标中,每个时序序列对应的多个音频频率中到达预设的音量阈值的点连线构成。

根据所述的方法,在所述时间-音频坐标中,所述时间为横坐标,所述音频频率为纵坐标;所述步骤A包括:

A1、采集所述欲辨识的音频片段中在预设音频频率范围及预设的时间段内的达预设的音量阈值的点,并根据预设的山脊点设置规制,在所述达预设的音量阈值的点中选择满足所述预设的山脊点设置规制的点作为山脊点;

A2在所述时间-音频坐标中将除纵向方向上之外的相邻的所述山脊点连接成第三山脊线;

A3、在所述第三山脊线包括多条时,选择其中达到预设时序序列长度的所述第一山脊线。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天迈科技有限公司,未经天迈科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201610649485.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top