[发明专利]基于正交正弦脉冲序列定位标签的语音时间规整方法有效
申请号: | 201310430339.0 | 申请日: | 2013-09-18 |
公开(公告)号: | CN103474083A | 公开(公告)日: | 2013-12-25 |
发明(设计)人: | 储飞黄;许士敏;王江;俞红兵;钱宇红;崔琛;余剑;孙战先 | 申请(专利权)人: | 中国人民解放军电子工程学院;储飞黄 |
主分类号: | G10L25/60 | 分类号: | G10L25/60 |
代理公司: | 安徽省合肥新安专利代理有限责任公司 34101 | 代理人: | 何梅生 |
地址: | 230037 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 正交 正弦 脉冲 序列 定位 标签 语音 时间 规整 方法 | ||
技术领域
本发明涉及基于输入-输出的语音可懂度测量方法或语音质量客观评价方法,主要应用于使通信或语音传输系统的输出语音信号与输入语音信号在时域对齐,即时间规整。
背景技术
基于输入-输出的语音可懂度测量方法或语音质量客观评价方法以原始语音作参考,评估通信或语音传输系统输出语音信号的失真程度,并以输出语音信号的失真度作为语音可懂度或语音质量预测依据。使用此类方法的前提是输出语音信号与输入语音信号在时域精确对齐,即时间规整。时间规整的本质是估计并消除输出语音信号与输入语音信号之间的时间延迟,估计精度直接影响后续语音质量或可懂度测量的精度。
通常情况下,语音信号处理以帧为基本分析单元,且帧长取值范围为25ms~64ms,时间规整的误差应远小于帧长,一般要求小于3ms。
目前,基于输入-输出的可懂度测量研究大多围绕参数提取与失真距离测量算法。已有算法通常基于语音信号自身包络进行时间规整,但语音包络自相关函数的主瓣宽度宽、主副比低,导致此类方法在低信噪比条件下的时间规整精度较低。
发明内容
本发明的目的在于提供一种基于正交正弦脉冲序列定位标签的语音时间规整方法。利用正弦脉冲序列之间的正交性,设计由一组正交正弦脉冲序列构成的定位标签,插入在测试语音之前,与原始语音信号一起组成测试信号,再将测试信号通过通信或语音传输系统后的输出信号与定位标签进行互相关运算,根据互相关函数最大值位置估计系统时延,实现通信或语音传输系统输入与输出信号的时间规整。
本发明为解决技术问题采用如下技术方案:
本发明基于正交正弦脉冲序列定位标签的语音时间规整方法的特点是:利用正弦脉冲序列之间的正交性,设计由一组正交正弦脉冲序列构成的定位标签并插入原始语音信号之前,与原始语音信号一起组成测试信号,再将测试信号通过通信或语音传输系统后的输出信号与定位标签进行互相关运算,根据互相关函数最大值位置估计系统时延,实现通信或语音传输系统输入与输出信号的时间规整。
本发明基于正交正弦脉冲序列定位标签的语音时间规整方法的特点在于按如下过程进行:
针对通信或语音传输系统设计语音测试信号,所述语音测试信号x(t)是在原始语音信号s(t)起始位置之前插入一段时长为L的正交正弦脉冲序列定位标签l(t),用式(1)表示为:
x(t)=l(t)+s(t-L) (1)
所述正交正弦脉冲序列定位标签l(t)按式(2)获得:
式(2)中,f0为正交正弦脉冲序列定位标签的基频,取值为10Hz-1.5kHz,为每个正弦脉冲序列的初始相位,取值范围不限,T0=1/f0;u(t)为阶跃函数,K是满足3kf0≤fmax的最大整数k,fmax是能通过待测通信或语音传输系统的语音信号的最高频率。
以语音测试信号x(t)为所述通信或语音传输系统的输入信号,将所述通信或语音传输系统的输出语音信号y(t)与定位标签l(t)进行互相关运算,然后将互相关函数取得最大值的位置偏移量作为通信或语音传输系统时延τ0的估计值进而以为起点,从通信或语音传输系统输出失真语音信号y(t)中截取与原始语音信号s(t)等长度的信号作为测试语音的输出响应,达到时间规整的目的。
与已有技术相比,本发明有益效果体现在:
1、本发明方法时间规整精度与测试样本无关,便于在实际应用中灵活控制;
2、本发明正交正弦脉冲序列定位标签的主要能量集中在音频范围,系统通过性好;
3、本发明定位标签的均方根带宽远大于语音包络的均方根带宽,时间规整精度显著提高;
4、本发明定位标签与语音、噪声弱相关或不相关,自相关函数近似于单位脉冲函数,具有很好的抗噪能力。
附图说明
图1为本发明方法原理框图;
图2为本发明方法中定位标签自相关函数波形实例;
图3为本发明方法中原始语音信号实例;
图4为本发明方法中插入定位标签后的测试信号实例;
图5为本发明方法中通信或语音传输系统输出语音信号实例;
图6为本发明方法中定位标签与系统输出语音的互相关函数波形实例;
图7为利用本发明方法进行时间规整后的语音信号实例。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军电子工程学院;储飞黄,未经中国人民解放军电子工程学院;储飞黄许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310430339.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新型平板电脑
- 下一篇:一种带电源灯新型双充车载充电器