[发明专利]一种音频修复方法、装置、设备及介质在审
申请号: | 202110652270.0 | 申请日: | 2021-06-11 |
公开(公告)号: | CN113409807A | 公开(公告)日: | 2021-09-17 |
发明(设计)人: | 王鹏;朱霜霜;高华 | 申请(专利权)人: | 北京字跳网络技术有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L25/51 |
代理公司: | 北京开阳星知识产权代理有限公司 11710 | 代理人: | 王雪 |
地址: | 100190 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音频 修复 方法 装置 设备 介质 | ||
本公开实施例涉及一种音频修复方法、装置、设备及介质,其中该方法包括:获取待处理的音频帧信号;检测音频帧信号中存在的截波区间;其中,截波区间中包含连续的多个截波点,截波点为幅值超过预设阈值的信号点;根据与截波区间临近的非截波点判断检测到的截波区间是否满足指定插值条件;如果是,基于非截波点采用指定插值法对截波区间进行修复。本公开实施例提供的上述音频修复方式所需的运算量很低,因此可极大缩短修复时间,可达到快速实时的音频修复效果。
技术领域
本公开涉及音频处理技术领域,尤其涉及一种音频修复方法、装置、设备及介质。
背景技术
在诸如音视频会议、网络直播和网络课程等场景都涉及到音频传播,但因诸如音频设备、录制方式、录制场合等各种原因都可能会出现音频截波(截幅)现象,从而导致音频失真。诸如,当用户使用的麦克风设备增益较高且播放设备的音量设定过高时,麦克风采集到的近端语音信号和远端回声信号的大小容易超出阈值而出现音频波形的截波现象,也即,超出阈值的波形部分会被截断。
相关技术中大多采用较为复杂的方式来进行音频修复,诸如,采用稀疏合成和稀疏分析模型法、最小均方自回归模型法和最小化高阶导数能量法等较为复杂的方式来进行音频修复,但是这种方式运算量非常大,修复用时较长,难以达到诸如音视频会议、网络直播、网络课程等场景所需的快速实时的音频修复效果。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种音频修复方法、装置、设备及介质。
本公开实施例提供了一种音频修复方法,所述方法包括:获取待处理的音频帧信号;检测所述音频帧信号中存在的截波区间;其中,所述截波区间中包含连续的多个截波点,所述截波点为幅值超过预设阈值的信号点;根据与所述截波区间临近的非截波点判断检测到的所述截波区间是否满足指定插值条件;如果是,基于所述非截波点采用指定插值法对所述截波区间进行修复。
可选的,所述获取待处理的音频帧信号的步骤,包括:将待处理音频进行分帧处理,得到初始帧信号;如果所述初始帧信号的原始数据类型并非指定数据类型,则将所述初始帧信号转换为所述指定数据类型;将转换后的初始帧信号作为待处理的音频帧信号。
可选的,所述方法还包括:将修复处理后的所述音频帧信号的数据类型转换为所述原始数据类型。
可选的,所述指定插值条件包括抛物线插值条件,所述根据所述截波区间临近的非截波点判断所述截波区间是否满足指定插值条件的步骤,包括:检测所述截波区间的首个截波点之前且在不跨越其它截波区间的情况下是否存在至少两个非截波点;以及,检测所述截波区间的末个截波点之后且在不跨越其它截波区间的情况下是否存在至少两个非截波点;如果检测结果均为是,确定所述截波区间满足抛物线插值条件。
可选的,所述基于所述非截波点采用抛物线插值法对所述截波区间进行修复的步骤,包括:计算与所述截波区间的首个截波点最临近的两个非截波点之间的第一斜率的绝对值,以及与所述截波区间的末个截波点最临近的两个非截波点之间的第二斜率的绝对值;如果所述第一斜率的绝对值小于或等于所述第二斜率的绝对值,选择与所述截波区间的首个截波点最临近的两个非截波点以及与所述截波区间的末个截波点最临近的一个非截波点进行抛物线插值计算,基于得到的第一插值计算结果对所述截波区间进行修复;如果所述第一斜率的绝对值大于所述第二斜率的绝对值,选择与所述截波区间的末个截波点最临近的两个非截波点以及与所述截波区间的首个截波点最临近的一个非截波点进行所述抛物线插值计算,基于得到的第二插值计算结果对所述截波区间进行修复。
可选的,所述方法还包括:采用预设平滑滤波算法,针对修复后的所述截波区间、位于所述截波区间的首个截波点之前的第一指定长度区间、以及位于所述截波区间的末个截波点之后的第二指定长度区间进行平滑处理。
可选的,所述方法还包括:针对修复后的所述音频帧信号进行动态范围压缩处理,以使修复后的所述音频帧信号的幅值范围均位于指定幅值范围区间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字跳网络技术有限公司,未经北京字跳网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110652270.0/2.html,转载请声明来源钻瓜专利网。