[发明专利]基于信源先验信息的语音帧修复方法和装置在审

专利信息
申请号: 201710565971.4 申请日: 2017-07-12
公开(公告)号: CN107564533A 公开(公告)日: 2018-01-09
发明(设计)人: 赵晓群;王缔罡;卢唐乐;薛兵 申请(专利权)人: 同济大学
主分类号: G10L19/00 分类号: G10L19/00;G10L19/005;G10L19/04
代理公司: 上海科盛知识产权代理有限公司31225 代理人: 翁惠瑜
地址: 200092 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 信源 先验 信息 语音 修复 方法 装置
【说明书】:

技术领域

发明涉及通信领域,尤其是涉及一种基于信源先验信息的语音帧修复方法和装置。

背景技术

随着通信技术的发展,现在很多语音通信很多是通过网际协议(IP:Internet Protocol)网络、无线网络进行连接、传输,在这种通信环境下,出现数据包丢失的概率更大。许多语音识别系统所具有的常见问题是准确性。用户可对着语音识别器说话,且系统可用识别文本做出响应,但所述识别文本通常可能含有许多错误,因为语音识别器未能恰当地识别人类用户的话语。

目前,数字语音通信技术几乎覆盖到了通信的每一个领域,计算机的发展为数字语音通信相关技术的研究提供了强有力的工具,大规模、超大规模集成电路的出现则为语音编码的实现提供了基础。在中低速率(16Kb/s以下)中获得高质量的语音编码一直是语音编码研究的主要目标。

在中低速率语音编码中,基于线性预测的声码器在发送端对语音信号进行解析,提取出语音信号的特征参数,主要包括激励参数、声道参数以及能量参数等,然后对参数进行量化与编码,经信道传输后,接收端再根据收到的特征参量恢复出语音信号。

随着移动通信和移动互联网的飞速发展,以及网络传输速率的不断提高,语音通信在便捷性和移动性方面已经取得了相当巨大的进步,因此,移动语音通信和互联网语音通信的占比也越来越大。然而,一些问题依然无法忽视,一方面,由于移动网络本身的不稳定性;另一方面,互联网语音要求通信低时延,而在差错率方面,要求较低。这些将导致语音数据在信道传输过程中产生的一些错误,解码端在合成语音时就会产生各种畸变,导致语音通信质量变化较大。针对该类问题,在以往的方法中,主要采用丢帧或者错误掩盖(插值)的方法。其实现过程为:在接收端,通过丢失语音帧的前帧、或前后帧相应的参数值来对当前帧的参数值进行插值运算,该类方法在一定程度上达到了基本要求。

但上述方法并没有有效地利用语音前后帧的相关性以及声道变化缓慢的特性,获得的语音质量还不够。

发明内容

本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于信源先验信息的语音帧修复方法和装置。在基于线性预测类的声码器中,关键参数(声道参数和能量参数)的连续性较强,本发明利用信源的先验知识以及接收端的错误帧来对该错误帧进行容错解码,通过该方法来提升合成语音的质量。

本发明的目的可以通过以下技术方案来实现:

本发明目的之一是提供一种基于信源先验信息的语音帧修复方法,包括以下步骤:

检测受损语音帧;

根据信源先验信息,确定所述受损语音帧中受损语音参数的位置;

根据信源先验信息,修复所述受损语音参数;

其中,所述信源先验信息包括当前帧的若干前帧、当前帧的若干后帧、各前帧语音参数和/或各后帧语音参数;

所述语音参数包括声道参数和/或能量参数。

所述检测受损语音帧具体为:

计算当前帧的CRC值;

判断CRC值是否等于校验值,若是,则当前帧未受损,若否,则当前帧为受损语音帧。

所述检测受损语音帧具体为:

获取信源先验信息,基于所述信源先验信息计算当前帧某一语音参数向量的条件概率;

判断该条件概率是否大于或等于对应语音参数向量的检测阈值,若是,则当前帧未受损,若否,则当前帧为受损语音帧。

确定所述受损语音帧中受损语音参数的位置的具体过程为:

根据若干前帧和/或若干后帧的某一语音参数向量计算当前帧的每一个对应语音参数的条件概率;

依次判断每一个对应语音参数的条件概率是否大于或等于该语音参数的检测阈值,若是,则对应位置的语音参数未受损,若否,则对应位置的语音参数为受损语音参数。

确定所述受损语音帧中受损语音参数的位置的具体过程为:

根据若干前帧和/或若干后帧的某一语音参数中的第i个值计算当前帧的第i个对应语音参数的条件概率;

依次判断每一个对应语音参数的条件概率是否大于或等于该语音参数的检测阈值,若是,则对应位置的语音参数未受损,若否,则对应位置的语音参数为受损语音参数。

修复所述受损语音参数具体为:

根据最大先验概率准则,利用若干前帧和/或若干后帧的语音参数向量恢复受损帧的对应受损语音参数。

修复所述受损语音参数具体为:

根据最大先验概率准则,利用若干前帧和/或若干后帧的第i个语音参数恢复受损帧的对应第i个受损语音参数。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710565971.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top