[发明专利]一种音频传输抗丢包的错误隐藏技术方法有效
申请号: | 202210157250.0 | 申请日: | 2022-02-21 |
公开(公告)号: | CN114613372B | 公开(公告)日: | 2022-10-18 |
发明(设计)人: | 冯建平;蔡昌毅;张晓冰;刘鎏;向仍湘;陈正榕 | 申请(专利权)人: | 北京富通亚讯网络信息技术有限公司 |
主分类号: | G10L19/00 | 分类号: | G10L19/00;G10L25/30;H04B14/04 |
代理公司: | 北京翔石知识产权代理事务所(普通合伙) 11816 | 代理人: | 李勇 |
地址: | 100085 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音频 传输 抗丢包 错误 隐藏 技术 方法 | ||
本发明涉及一种音频传输抗丢包的错误隐藏技术方法,涉及实时音频通信技术领域,包括,步骤S1,获取音频帧数据的高维序列,构造输入矩阵与目标值矩阵;步骤S2,利用输入矩阵与目标值矩阵训练回归模型,并获取预测值矩阵;步骤S3,接收音频帧数据并判定,利用预测值对音频帧数据空缺进行错误隐藏,并对预测值矩阵进行修正。本发明通过相空间重构获得音频帧数据的高维序列,高维向量空间比一维脉冲编码调制采样值能更好的刻划音频数据随时间不断演进的动态特性,并结合不同的机器学习模型能对即将接收音频数据作出更好的预测,使用预测值屏蔽缺失的影响,完成错误隐藏,降低错误隐藏帧与原始音频帧的差异,提高音频传输质量。
技术领域
本发明涉及实时音频通信技术领域,尤其涉及一种音频传输抗丢包的错误隐藏技术方法。
背景技术
音频通信是通过麦克风采集原始脉冲编码调制PCM音频帧、压缩编码成特定格式,比如G.722、G.718、AMR-WB、OPUS,再通过IP网络发送给接收端解码,还原成脉冲编码调制PCM数据,并由声卡播放。压缩音频包经过网络传输后可能会丢失,如果通过带宽比较受限的链路,比如卫星信道,还可能造成大延迟及时延抖动,接收端一般通过jitter缓冲区对收到的压缩音频包进行排队并检测出RTP层包序号的不连续,对于因此而缺失的音频帧,可以使用错误隐藏PLC算法将其重构出来,常规的PLC包括但不限于:填零、重复前一帧、将前几帧外插值后得到等,jitter缓冲区要么将连续收到的包交由解码器解码,要么在发生丢包时通知解码器内置或外置的错误隐藏PLC模块重构出一帧。
但现有的错误隐藏PLC很难在通用兼容各种音频编码格式、开放待选的机器学习模块可随意增减、实时重构时仅运用缺失前的信号数据以及感官效果这四个方面都取得较优,缺乏在脉冲编码调制PCM的相空间重构PSR分解映射以及相关参数的考量和计算,并在利用某个机器学习模型对正确传输并缓存下来的脉冲编码调制PCM数据进行学习建模时,不具备为丢失帧作出较复杂非线性预测的能力,造成错误隐藏帧与原始音频帧存在较大差异。
发明内容
为此,本发明提供一种音频传输抗丢包的错误隐藏技术方法,用以克服现有技术中错误隐藏帧与原始音频帧存在较大差异的问题。
为实现上述目的,本发明提供一种音频传输抗丢包的错误隐藏技术方法,包括,
步骤S1,通过相空间重构将任意一音频帧数据的脉冲编码调制一维序列解构到若干个同相空间,获得该音频帧数据的高维序列,根据该音频帧数据的高维序列构造输入矩阵,再根据输入矩阵构造目标值矩阵;
步骤S2,将构造完成的输入矩阵与目标值矩阵分为训练数据和测试数据,分别选用支持向量机、随机森林、前馈神经网络算法进行训练与测试,根据支持向量机、随机森林、前馈神经网络三种算法的测试预测值确定回归模型,将输入矩阵输入到回归模型中,得到预测值矩阵;
步骤S3,对即将接收的新的音频帧数据进行判定,根据新的音频帧数据的数据量判定是否通过预测值矩阵对新的音频帧数据的空缺进行错误隐藏,解构新的音频帧数据的高维序列,并将新的音频帧数据的高维序列与预测值矩阵中对应相预测值进行对比,根据对比结果计算预测值矩阵中对应相预测值的符合度,再根据预测值矩阵中对应相预测值的符合度判定是否对新的音频帧数据的高维序列进行学习,以对预测值矩阵进行修正。
进一步地,在所述步骤S1中,将任意一音频帧数据的脉冲编码调制一维序列x(t)进行相空间重构处理,得到该音频帧数据的高维序列X(t),
X(t)=[x(t),x(t+τ),...,x(t+(m-1)τ)]
其中,τ为时延;m为嵌入维数度;t为基础帧值。
进一步地,根据高维序列X(t)构造输入矩阵X,
其中,M为大于基础帧值的最小整数帧值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京富通亚讯网络信息技术有限公司,未经北京富通亚讯网络信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210157250.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:来电处理方法、装置、设备及介质
- 下一篇:一种兼具异步通信功能的关联成像系统