[发明专利]一种声音信号检测和识别的方法有效
申请号: | 201110383102.2 | 申请日: | 2011-11-28 |
公开(公告)号: | CN102419972A | 公开(公告)日: | 2012-04-18 |
发明(设计)人: | 冯祖仁;程欣;贠光梅;高紫晨;刘振;郭文涛 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G10L11/00 | 分类号: | G10L11/00 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 陆万寿 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 声音 信号 检测 识别 方法 | ||
技术领域:
本发明涉及一种声音的检测和识别方法,特别涉及一种能够对弱声音信号的检测和识别也特别有效的基于声音信号的特征化表达、背景抑制处理、信号检出和数据融合的声音信号检测和识别方法。
背景技术:
声音检测和识别技术在国防,安全监控,人机交互等领域均有着广泛的应用,特别是由于声音的检测和识别的方法相对于图像的检测与识别方法,机动灵活且不易受到自然条件的影响,近年来吸引了越来越多研究者的注意。成为当前计算机声音处理领域中的研究热点之
在计算机声音处理领域,目前常用的数学分析工具有短时傅里叶变换、小波变换、小波包变换等。通过这些数学分析工具,我们可以对声音信号进行详细的时频域分析,比如在对声音信号进行时域分析时,可以获得声音信号的过零率、振幅、周期、能量等信息;进行频域分析时可以获得声音信号的频谱分布、基频频率、各次谐波频率,Mel倒频谱系数等信息。通过对这些声音信号进行时频谱分析,可以检测出声音信号中所包含的有用信息。其中,短时傅里叶变换通过选择不同的窗函数可以反映出不同时变信号局部的时域和频域的综合信息,而小波变换则是法国从事石油信号处理的工程师J.Morlet在1974年首先提出的一种变换方法,它与傅里叶变换等变换相比,是一个时间和频率的局网域变换,因而能有效的从信号中提取资讯,它可以通过伸缩和平移等运算功能对函数或信号进行多尺度细化分析,解决傅里叶变换不能解决的许多困难问题,因而小波变化被誉为“数学显微镜”,它是调和分析发展史上里程碑式的进展。它的正交性和多分辨分析性已经成功应用于很多领域,特别在声音信号处理领域,小波变换的的多分辨分析性已经被广泛地利用作由粗到精的逐步观察声音信号。诸多学者在这一领域进行了大量的研究,例如:马宁等人用短时傅里叶变换及小波变换理论分析了强噪声背景下雷达弱信号检测方法,利用小波变换的“变焦特性”能够有效地从强噪声背景中检测到弱信号,从而将目标从噪声中检测出来。徐岩等人采用从强噪声中提取话音信号的自适应噪声抵消技术入手,对最小均方误差的性能进行了分析,针对其收敛速度慢、提取信号频带窄的缺点,提出了改进的有动量因子的自适应最小均方误差算法,对解决弱信号提取问题有一定效果。童宁宁等人分析了小波包变换的良好时频分析特性,根据信号与噪声具有不同的Lipschitz指数,通过引入子频带∞-范数,对信号和噪声进行频谱分析,将最佳子空间的熵值及最佳子空间在完整二叉树中的位置参数作为特征量,并应用浮动阈值去噪方法,解决了低信噪比情况下的弱信号检测问题。通过计算机的数值计算,模拟了浮动阈值去噪法基于小波包变换和小波变换的强噪声背景下的弱信号检测,从仿真的波形图中得出在低信噪比情况下的弱信号检测方面小波包变换优于小波变换。
在当前声音检测和识别领域中,广泛应用的理论和方法是基于统计学中假设检验的似然比检验。但是由于在实际应用中对人类有用的信息往往被淹没在强的背景声音干扰中,人类采集到数据信号一般是非平稳的,并且只有很低的信干比(信噪比)。而当传统的信号检测与识别方法在碰到信干比(信噪比)很低或非白噪声干扰或非平稳干扰声音(噪声)的时候,系统的检测性能会急剧下降,很难获得较高的检测率。
发明内容:
为了解决上述声音检测和识别领域中的问题,从而在更低的信噪比条件下和更加复杂的信号环境下也能有效地进行声音信号的检测和识别,发明人利用目前热门的信号处理理论进行信号检测方面的研究,提出了一种基于声音时频域变换的声音检测算法,能够克服当前统计学中假设检验似然比检验方法的固有缺陷,提供一套有效的系统的实时声音信号检测和识别算法。
本发明采用的技术方案如下:
一种声音信号检测和识别的方法,包括以下步骤:
步骤一,预处理过程:首先利用目标声音的特征化表达方式将目标声音制作成目标模板{Qu};接着将实时获取的原始声音信号进行分帧,每一定长度的数据分成一帧,每帧之间重叠一定的长度;同时初始化计数器i为零,初始化最终检测和识别量化结果{Ri|i=1,2,…LENGTH}的每个元素为零,初始化加权系数{αi|i=1,2,…M}的所有元素为零;
步骤二,帧数据的特征化:通过分帧后原始声音的特征化表达方式计算第i帧数据的特征向量{Su};
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110383102.2/2.html,转载请声明来源钻瓜专利网。