[发明专利]基于SVM和GMM的特定音频事件分层泛化识别方法无效

专利信息
申请号: 201210226349.8 申请日: 2012-06-29
公开(公告)号: CN102799899A 公开(公告)日: 2012-11-28
发明(设计)人: 罗森林;王坤;潘丽敏;谢尔曼 申请(专利权)人: 北京理工大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 暂无信息 代理人: 暂无信息
地址: 100081 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 svm gmm 特定 音频 事件 分层 泛化 识别 方法
【说明书】:

技术领域

发明涉及一种融合支持向量机(SVM)和高斯混合模型(GMM)的特定音频事件分层泛化识别方法,属于计算机与音频事件识别技术领域。

背景技术

特定音频事件是用户指定的具有某种特定语义或内容的一个音频片段。

随着计算机和网络技术迅速发展,音视频文件以及流媒体数据量迅速膨胀,从海量音频信息中迅速准确地发现或识别出所需要的特定音频事件变得越来越重要。由于交通监控、敏感区域安全监测等应用的迫切需求,特定音频事件识别技术近年来得到了广泛的研究。

特定音频事件识别技术就是基于音频数据的内容,将音频流中的特定音频事件识别出来,在音频信息处理研究领域中,特定音频事件识别也被称为音频事件检测(Audio Event Detection)、音频事件识别(Audio Event Recognition)、音频分类(Audio Classification)等。特定音频事件通常包括多种子类音频事件(例如枪声包括机关枪声、手枪声、步枪声等),且子类之间具有较大的差异。泛化识别就是在加强大类之间区分度的同时降低子类差异敏感度,提取子类的共性特征达到泛化的目标,使用尽可能少的子类模板去适应尽可能大的类内差异。

基于内容的音频分析研究可以划分为4个层次:数据层、特征层、类别层、语义层。特定音频事件识别又被称为音频事件识别、音频分类等,属于上述4层划分的类别层。在研究工作中,人们也在特征层对特征提取、特征筛选与组合、特征向量生成等技术开展研究。

近年来,特定音频事件识别的相关研究主要集中在音频特征提取和分类器设计两个方面。音频特征提取技术是音频类型识别的基础,它从音频波形中提取出特征向量用于后一阶段的识别(或分类);分类器设计的目标是为特定音频事件识别寻找或设计分类算法,提高识别准确率、减少识别耗时,并研究算法参数对识别性能的影响。

1.在特征提取方面:

在音频特征提取方面,早期的音频特征包括:短时能量、静音率、过零率、和谐度、基频、频谱、谱中心、子带能量;后来又引入了线性预测系数、Mel倒谱系数(Mel-Frequency Cepstral Coefficient,MFCC)等多种感知及倒谱域特征;近年来,一些新的音频特征和特征筛选算法也陆续被提出。

(1)简单音频特征:由于特定音频事件识别技术发源于信号处理、语音识别等相关理论,因此诸如短时能量、过零率、子带能量等简单特征,被广泛应用于特定语音识别研究。

(2)倒谱及感知特征:在语音处理领域中,LPC、LPCC、LFCC、MFCC等特征得到了越来越多的应用,研究者将这些特征引入特定类型音频事件识别领域,取得了较好的识别效果。

(3)统计特征及新的底层特征:在特定音频事件识别领域中,研究者对上述两大类底层特征进行统计;或使用音频压缩域特征,使音频特征向量更具代表性,例如MPEG7特征、频谱直方图等。同时,新的底层特征也不断被提出。

此外,更早的一些研究还包括直方图、梯度直方图、基于分段仿射变换的表情特征点运动特征等。对于维度较大的特征类型,还常常涉及到降维处理,常见的特征降维处理方法有:聚类线性鉴别分析方法、主成分分析法等。

总之,在底层音频特征的提取研究上,经历了“能量、过零率等简单特征——LPC、LPCC、MFCC等频域及倒谱特征——MPEG7、频谱直方图等底层特征及其统计、描述”的发展过程。对于某大类的特定音频事件,其中的子类一般具有较大的差异性(例如枪声包括机关枪声、手枪声、连续枪声等子类,各子类样本间有着较大的差异),如何有针对性地选择特征,采用更好的特征向量构造方法,使其具有较强的大类之间区分度和较小的子类差异敏感度,是特定音频事件识别研究下一步需要解决的问题。

2.在音频分类器设计方面:

在分类器设计研究方面,目前的研究主要包括:支持向量机(Support Vector Machine,SVM)、基于高斯混合模型(Gaussian Mixture Model,GMM)等。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210226349.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top