[发明专利]一种对带噪语音进行语音活动检测的方法有效

专利信息
申请号: 201610445448.3 申请日: 2016-06-21
公开(公告)号: CN106128480B 公开(公告)日: 2019-08-13
发明(设计)人: 刘冲冲;周正仙;甘露;吴朝晖;杜友武;余瑞兰;袁扬胜;邹翔 申请(专利权)人: 安徽师范大学
主分类号: G10L25/84 分类号: G10L25/84
代理公司: 芜湖安汇知识产权代理有限公司 34107 代理人: 马荣
地址: 241000 安徽省*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种对带噪语音进行语音活动检测的方法,包括步骤:采集语音信号;输入步骤a采集的语音信号;对输入的带噪语音进行分帧处理;计算相邻帧快速傅立叶变换模的互相关值;基于步骤d所得互相关值计算出每一帧的语音存在概率。本发明提出的语音活动检测方法鲁棒性强,可以在不同的噪音环境中计算出带噪语音信号中的语音存在的概率。
搜索关键词: 一种 语音 进行 活动 检测 方法
【主权项】:
1.一种对带噪语音进行语音活动检测的方法,其特征在于,包括如下步骤:a.采集语音信号;b.输入步骤a采集的语音信号;c.对输入的带噪语音进行分帧处理;d.计算相邻帧快速傅立叶变换模的互相关值;e.基于步骤d所得互相关值计算出每一帧的语音存在概率;其中步骤d中包括:(d‑1)对分帧后的带噪语音做快速傅立叶变换后取模;(d‑2)求相邻帧的模的互相关值;(d‑3)求相邻帧的模的互相关值后,取其四次方根;(d‑4)互相关值四次方根需要减去所有互相关值四次方根幅度分布最大值对应的横坐标,并且小于零的数值归零;其中步骤e中包括:(e‑1)归一化处理;(e‑2)平滑处理;(e‑3)得到语音概率;其中,步骤(e‑1)中,对xdata2(i)做归一化处理,得xdata3(i)=xdata2(i)/max(xdata2);步骤(e‑2)中,对xdata3(i)做平滑处理,得xsp(i)=xdata3*hamming(len2);步骤(e‑3)中,得到xsp(i)即表示第i帧包含语音的概率;步骤(d‑1)中,对各帧做快速傅立叶变换(FFT)并取模,加汉明窗平滑,得到xfft(i)=abs(FFT(x(i)))*hamming(L),其中abs表示取模运算,*表示卷积运算,hamming(L)表示窗长为L的汉明窗,L可根据具体应用调整;步骤(d‑2)中,对相邻两帧的xfft做互相关运算,得到xcorr(i)=∑xfft(i)·xfft(i+1);步骤(d‑3)中,对xcorr(i)取四次方根,得到xdata(i)=(xcorr(i))1/4;步骤(d‑4)中,计算xdata(i)的幅度分布,得到幅度分布最大值对应的横坐标m=abscissa(max(H(xdata))),max(*)表示*的最大值,H(*)表示*的幅度分布,abscissa(*)表示*的横坐标;计算xdata2(i)=max(0,xdata(i)‑m);xfft(i)为平滑后得到的信号一,xcorr(i)为互相关运算后得到的信号二,xdata(i)为四次方根后得到的信号三,xdata2(i)为幅度分布处理后得到的信号四,xdata3(i)为归一化处理后得到的信号五。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽师范大学,未经安徽师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610445448.3/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top