[发明专利]数字电话会议的桥路运算方法无效
申请号: | 200910103824.0 | 申请日: | 2009-05-11 |
公开(公告)号: | CN101557443A | 公开(公告)日: | 2009-10-14 |
发明(设计)人: | 黄河清;高世幸;廖红云 | 申请(专利权)人: | 重庆金美通信有限责任公司 |
主分类号: | H04M3/56 | 分类号: | H04M3/56 |
代理公司: | 重庆市恒信知识产权代理有限公司 | 代理人: | 侯懋琪 |
地址: | 400030重*** | 国省代码: | 重庆;85 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数字 电话会议 运算 方法 | ||
1.一种数字电话会议的桥路运算方法,其特征在于:采用时延抖动处理机制对多网段码流整形;采用单帧检测与长时窗检测相结合的VAD语音激活检测和采样率匹配算法,减少进入桥路运算的无效通道数并降低运算误判率;采用短时幅度和运算及漏斗混音运算,降低运算量;
该方法步骤如下:系统对接收到的不同网段信号:1)进行FIFO缓冲,2)解码,3)单帧检测与长时窗检测相结合的VAD语音激活检测,4)采样率匹配,5)短时幅度和计算,6)桥路运算,7)采样率还原,8)漏斗混音运算,9)系统发送端每10ms对各通道送出均匀、连续的10ms码流量;桥路运算周期10ms;
所述漏斗混音运算包括:在10ms单位桥路处理周期内,由步骤5)对各通道进行短时幅度和计算,得出短时幅度和最大通道及短时幅度和第二大通道,将短时幅度和第二大通道的话音信息送给发言者通道,将短时幅度和最大通道话音信息发送给其他所有参会通道;
所述单帧检测与长时窗检测相结合的VAD语音激活检测,包括:从各个通道解码后的语音帧中提取4种语音特征参数,根据4种语音特征参数与对应的背景噪声的运行平均值的差值构造判据,根据判据进行单帧检测,根据单帧检测结果进行长时窗检测,根据长时窗检测结果确定该通道状态;
前述4种语音特征参数为:
线谱频率:{LSFi},i=1,…10,由线性预测分析得到的一组线谱频率LSF系数;
全带能量: 其中R(0)为输入语音的第一个自相关系数,N=240为LPC分析窗的长度;
子带能量: 该子带能量是指输入语音在0-1kHz频段的能量,其中h为截止频率1khz的FIR滤波器的冲击响应,R为13阶托伯里兹自相关系数矩阵;
归一过零率:其中{x(i)}为输入语音信号,i为序数,M=80为编码的帧长度;
4种语音特征参数与对应的背景噪声的运行平均值的差值构造出的判据如下:
1)如果ΔS>a1ΔZCR+b1那么IVD=1;
2)如果ΔS>a1ΔZCR+b2那么IVD=1;
3)如果ΔEf<a3ΔZCR+b3那么IVD=1;
4)如果ΔEf<a4×ΔZCR+b4那么IVD=1;
5)如果ΔEf<b5那么IVD=1;
6)如果ΔEf<a6×ΔS+b6那么IVD=1;
7)如果ΔS>b7那么IVD=1;
IVD=1表示当前语音通道为激活状态;IVD=0表示当前语音通道为非激活状态;
其中,
LSFi为语音特征参数中的线谱频率;Ef为语音特征参数中的全带能量;为语音特征参数中的子带能量;ZCR为语音特征参数中的归一过零率;
为:分别与前述4种语音特征参数对应的背景噪声的运行平均值,此运行平均值分别为4种语音特征参数在前32帧的平均值;
前述14个判据中的常量取值见下表:
判据处理样点长度10ms,采样率8khz;对上述14个判据作出判断的过程即为单帧检测,单帧检测结果作为长时窗检测的输入;
长时窗检测采用300ms进行,包括:若由前述14个判据作出的判断结果在300ms长时窗内均为IVD=1,则判断当前语音通道为活动通道;若由前述14个判据作出的判断结果在300ms长时窗内均为IVD=0,则判断当前语音通道为非活动通道;若由前述14个判据作出的判断结果在300ms长时窗中,IVD=1和IVD=0同时存在,则判断该语音通道保持为前一状态;语音通道状态为活动通道时,该通道才参与桥路运算,否则该通道不参与桥路运算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆金美通信有限责任公司,未经重庆金美通信有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910103824.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:燃料喷射阀和用于制造燃料喷射阀阀座的方法
- 下一篇:废气流量调整器