[发明专利]一种抑制网络丢包影响的语音数据后处理方法有效

申请号：	201210041994.2	申请日：	2012-02-23
公开（公告）号：	CN102568488A	公开（公告）日：	2012-07-11
发明（设计）人：	何佳;王小敏;王大勇;尼秀明	申请（专利权）人：	安徽创世科技有限公司
主分类号：	G10L19/00	分类号：	G10L19/00;G10L19/14;G10L21/02
代理公司：	合肥天明专利事务所 34115	代理人：	金凯
地址：	230088 安徽省合肥市***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种抑制网络影响语音数据处理方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及一种语音数据的后处理方法，具体是一种抑制网络丢包影响的语音数据后处理方法。

背景技术

随着近年来互联网的迅猛发展，如视频会议、视频监控、VOIP等基于网络音视频技术的各种应用和产品得到了迅速的推广。其中音频数据在网络上传输时，为了保证实时性，大多数应用都是基于UDP进行传输的。UDP传输数据的特点是传输时不能保证负载数据的完整性。因此传输的音频数据不可避免的会产生丢包。如果丢包后的数据不做任何处理，直接播放会引入很多高频噪音，影响主观听觉感受。

人们对音频数据在网络传输丢包的后处理方法进行了相关的研究，如：[1]、在分布式语音识别处理和系统中减轻传输错误影响的方法和设备，专利申请号：01809628.X；[2]、处理丢失帧的语音通信系统及方法，专利申请号：01812823.8；[3]、一种在网络上传输IP语音包的丢包恢复方法，专利申请号：00129594.2。专利[1]主要是基于识别并替换传输的错误语音参数来进行语音处理，而基于UDP的数据传输一般都是数据包丢失，而数据包内容错误的情况非常少见；专利[2]、专利[3]的目的都是要减轻数据包丢失造成的影响，不过这两个方法采用的思路是通过曲线拟合、波形插值、线性预测等方法恢复丢失的数据包的语音数据，这样的处理思路一般要缓冲丢失数据包前后各若干个数据包进行处理，需要内存较多，且影响语音播放的实时性。

发明内容

本发明要解决的技术问题是提供一种抑制网络丢包影响的语音数据后处理方法，在网络传输过程中数据包丢失情况下，对收到的前后两个数据包的边缘数据进行拟合校正，通过滤除采样点幅值突变而引入的高频噪音，改善了主观听觉感受。

本发明的技术方案为：

一种抑制网络丢包影响的语音数据后处理方法，其特征在于：包括以下步骤：

（1）、将每一个音频数据包记为，每个数据包都由个采样点组成，第个采样点幅值记为，=0……-1；

（2）、一个新接收到的数据包，如果其通过数据包序列号的方式判断出和上一次接收的数据包之间没有数据丢失时，则此数据包的播放按正常方式播放上一次接收的数据包，并且将此数据包缓冲起来；如果此数据包通过数据包序列号的方式判断出和上一次接收的数据包之间有数据丢失时，则将上一次接收的数据包记为，将这次接收的数据包记为；

（3）、如果一个点的幅值大于前后两点的幅值，我们称为极值点；在的采样点中从后向前找到的第一个极值点记为，在的采样点中从前向后找到的第二个极值点记为；

（4）、以数据包每个采样点的序号为横坐标，幅值为纵坐标，对和前后各一个点做正弦函数曲线拟合，得以下函数式[1]：；对和前后各一个点同样按正弦函数曲线进行拟合，得以下函数式[2]：；

（5）、[，]对区间之间的点按式[1]和式[2]的线性组合后得的式[3]来求取新的幅值替代原来的幅值，函数式[3]为：；

（6）、将更改了之后若干点幅值的新的数据包即时播放，并且将更改了之前若干点幅值的新的数据包缓冲起来用于后续数据包的处理；

（7）、返回步骤1重新开始处理下一个接收到的数据包。

本发明的有益效果：本发明对收到的前后两个数据包的边缘数据进行拟合校正，滤除了采样点幅值突变而引入的高频噪音，从而改善主观听觉感受，该方法具有低延时、内存需求少、复杂度低的优点。

附图说明

图1是没有校正前的采样点波形图，其中，空心圈代表了前一个数据包的采样点的幅值，空心矩形代表了当前接收的数据包的采样点的幅值，代表前一个数据包从后向前的第一个极值点，代表当前接收的数据包从前向后的第二个极值点。

图2是校正后的采样点波形图，其中空心圈代表了前一个数据包的采样点的幅值，空心矩形代表了当前接收的数据包的采样点的幅值，实心圈代表了校正后的采样点的幅值，实心圈代表了校正后的采样点的幅值，代表前一个数据包从后向前的第一个极值点，代表当前接收的数据包从前向后的第二个极值点。

具体实施方式

一种抑制网络丢包影响的语音数据后处理方法，其特征在于：包括以下步骤：

（1）、将每一个音频数据包记为，每个数据包都由个采样点组成，第个采样点幅值记为，=0……-1；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于安徽创世科技有限公司，未经安徽创世科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201210041994.2/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种抑制网络丢包影响的语音数据后处理方法有效

专利文献下载