[发明专利]一种智能音频辨识系统及辨识方法有效
申请号: | 200710075008.4 | 申请日: | 2007-06-07 |
公开(公告)号: | CN101067930A | 公开(公告)日: | 2007-11-07 |
发明(设计)人: | 徐扬生;覃剑钊;程俊;吴新宇;李崇国 | 申请(专利权)人: | 深圳先进技术研究院 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/02;G10L19/02 |
代理公司: | 深圳市君胜知识产权代理事务所 | 代理人: | 王永文 |
地址: | 518067广东省深圳市南山区蛇*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 智能 音频 辨识 系统 方法 | ||
技术领域
本发明涉及一种能够对音频数据自动辨识的系统及方法。
背景技术
听觉是人类获取外部信息的重要来源之一,也是人类用于分辨外部发生情况的重要渠道,如:当听到狗叫声,就可以判定附近可能有狗;当听到尖叫声,就可判定附近可能有人受到伤害。通过对音频的分析可以提供给本发明许多重要的信息。目前大多数基于音频的分析系统主要完成的功能是对采集到的原始音频进行预处理,如:去噪声,提取或加强指定特征的音频,但最后对音频的辨识都需要人的参与。而在自然界众多的应用场合中,需要对不同声响进行自动辨识,例如,对于在野外从事野生动物科研工作的野生动物学家,需要花费很多时间追踪一些罕见的野生动物, 如果能有音频数据自动辨识系统来辨识某种野生动物的叫声,当辨识出该种动物的声音后发出信号,则能帮助野生动物学家进行追踪。又如可在电梯、家庭设有对音频自动辨识系统的话,就可以对尖叫声、打闹声、撞击声、玻璃破碎声、爆炸声、枪击声等异常声响进行自动辨识,并发出报警信号给监控人员,从而提高监控人员对异常情况处理的反应时间。因此,实现自动的对音频进行辨识,将具有重要、广泛的应用价值。
发明内容
本发明所要解决的技术问题是:提供一种智能音频辨识系统及自动辨识方法,对音频数据进行自动辨识。
本发明为解决上述技术问题所采用的技术方案为:
一种智能音频辨识方法,包括以下步骤:
A、采集各种样本音频数据,对采集到的样本音频数据进行标注;
B、逐一从所述样本音频数据中提取出反映样本音频数据本质特征的特征向量,其中包括以下步骤:B1、对所述样本音频数据进行预处理,得到训练数据;B2、从训练数据中提取反映训练数据本质特征的特征成分;B3、将所述特征成分进行组合,得到所述特征向量;
C、根据所述特征向量划分样本音频数据所属类别区域,使得划分后的各个不同类别区域中包含尽量多的该类样本的特征向量,建立从特征向量到所属类别之间映射关系的分类器;
D、对待辨识音频数据进行处理,提取待辨识音频数据的特征向量,其中包括以下步骤:D1、对所述待辨识音频数据进行预处理,得到辨识数据;D2、从辨识数据中提取反映辨识数据本质特征的特征成分;D3、将所述特征成分进行组合,得到所述特征向量;
所述步骤B2或D2所述的特征成分包括:音频的中心频率、数个特定频率段内音频的能量特征或多个时段内音频的能量分布特征;
E、将待辨识音频数据的特征向量输入到所述分类器,分类器根据所述待辨识音频数据的特征向量进行判别,得到对该待辨识音频数据的辨识结果。;
F、根据所述辨识结果判断有异常声响时,发出报警信号。
所述的方法,其中:所述步骤B3或D3所述的特征向量为音频的中心频率与数个特定频率段内音频能量谱之和的矢量和。
所述的方法,其中:步骤C所述的所属类别区域根据所述特征向量的数值来划分,并由曲线或曲面来限定。
所述的方法,其中:所述步骤E包括如下处理:
E1、将待辨识音频数据的特征向量输入到所述分类器,分类器根据待辨识音频数据的特征向量进行判别,得到待辨识音频数据划分到所属类别的分类结果以及拒判指数,所述拒判指数是用来衡量分类结果可信度的参数;
E2、根据拒判指数判断分类结果的可信度,当拒判指数高于预设门限时,判定所述分类结果可信,分类器给出待辨识音频数据所属类别;当拒判指数低于预设门限时,分类器给出待辨识音频数据所属类别的同时,提示该分类结果不可信。
所述的方法,其中:所述步骤A包括对采集到的样本音频数据进行辨识,确定并注明该样本音频数据是哪一类声音。
一种智能音频辨识系统,包括一用于采集并存储各类样本音频数据的音频数据集、一训练单元、以及辨识单元和一报警单元;所述训练单元用于提取样本音频数据的特征向量,并寻找和建立从样本音频数据特征向量到样本音频数据所属类别之间的映射关系;所述辨识单元用于存放已建立的音频数据特征向量与音频数据所属类别之间映射关系的数据,以及提取待辨识音频数据特征向量,并根据待辨识音频数据的特征向量,给出辨识结果;所述报警单元用于根据所述辨识结果判断有异常声响时,发出报警信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳先进技术研究院,未经深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710075008.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:盘式捕蝇器
- 下一篇:金属气阀送丝管固定装置