[发明专利]一种基于通话的音频数据处理方法及装置在审
申请号: | 201910731048.2 | 申请日: | 2019-08-08 |
公开(公告)号: | CN110430330A | 公开(公告)日: | 2019-11-08 |
发明(设计)人: | 孙承秀;杨攀 | 申请(专利权)人: | 北京云中融信网络科技有限公司 |
主分类号: | H04M9/08 | 分类号: | H04M9/08;G10L21/0208;G10L21/003;G10L21/007;G10L21/013 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 刘亚飞 |
地址: | 100000 北京市海淀区万*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频数据处理 重采样 通话 目标音频数据 通话音频数据 叠加数据 目标音频 音频数据 音频文件 采样率 融合 解码 编码信息 混音处理 通话对方 音频效果 音频信息 预先设置 通话方 预设 采集 申请 | ||
1.一种基于通话的音频数据处理方法,其特征在于,包括:
按照预先设置的采样率采集通话方的音频信息,得到通话音频数据;
获取待融合的目标音频文件,对所述目标音频文件进行解码,得到目标音频数据;
按照所述采样率,对所述目标音频数据进行重采样,得到重采样音频数据;
对所述通话音频数据和所述重采样音频数据进行混音处理,得到音频叠加数据;
按照预设的编码信息,对所述音频叠加数据进行编码,得到融合音频文件,将所述融合音频文件发送给通话对方。
2.如权利要求1所述的方法,其特征在于,在所述得到音频叠加数据之后,按照预设的编码信息,对所述音频叠加数据进行编码之前,所述方法还包括:
利用混响算法,对所述音频叠加数据进行应用场景混响处理。
3.如权利要求1所述的方法,其特征在于,所述对所述通话音频数据和所述重采样音频数据进行混音处理,得到音频叠加数据,包括:
针对每一采样点,计算所述通话音频数据和所述重采样音频数据在该采样点的幅值的和值;
判断所述和值是否超过预先设置的幅值阈值,若超过,在该采样点处,为所述通话音频数据和所述重采样音频数据设置衰减因子;
叠加设置衰减因子后的通话音频数据和重采样音频数据,得到音频叠加数据,其中,设置衰减因子后的通话音频数据的幅值与重采样音频数据的幅值的和值不大于所述幅值阈值。
4.如权利要求3所述的方法,其特征在于,在所述计算所述通话音频数据和所述重采样音频数据在该采样点的幅值的和值之前,所述方法还包括:
判断该采样点对应的通话音频数据的幅值是否小于预先设置的通话阈值;
若该采样点对应的通话音频数据的幅值小于预先设置的通话阈值,将所述重采样音频数据作为所述音频叠加数据;
若该采样点对应的通话音频数据的幅值不小于预先设置的通话阈值,执行所述计算所述通话音频数据和所述重采样音频数据在该采样点的幅值的和值的步骤。
5.如权利要求1至4任一项所述的方法,其特征在于,在所述得到重采样音频数据之后,对所述通话音频数据和所述重采样音频数据进行混音处理之前,所述方法还包括:
对所述通话音频数据和所述重采样音频数据分别进行回音消除处理以及噪声抑制处理。
6.如权利要求1至4任一项所述的方法,其特征在于,在所述得到目标音频数据之后,按照所述采样率,对所述目标音频数据进行重采样之前,所述方法还包括:
对所述目标音频数据进行抗混叠滤波处理或抗镜像滤波处理。
7.如权利要求1至4任一项所述的方法,其特征在于,所述对所述目标音频文件进行解码,得到目标音频数据,包括:
解析所述目标音频文件,获取所述目标音频文件中包含的编码信息,依据所述编码信息对所述目标音频文件中包含的音频信息进行解码,得到目标音频数据。
8.一种基于通话的音频数据处理装置,其特征在于,包括:
音频采集模块,用于按照预先设置的采样率采集通话方的音频信息,得到通话音频数据;
解码模块,用于获取待融合的目标音频文件,对所述目标音频文件进行解码,得到目标音频数据;
重采样模块,用于按照所述采样率,对所述目标音频数据进行重采样,得到重采样音频数据;
混音模块,用于对所述通话音频数据和所述重采样音频数据进行混音处理,得到音频叠加数据;
编码模块,用于按照预设的编码信息,对所述音频叠加数据进行编码,得到融合音频文件,将所述融合音频文件发送给通话对方。
9.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至7任一所述的基于通话的音频数据处理方法的步骤。
10.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至7任一所述的基于通话的音频数据处理方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京云中融信网络科技有限公司,未经北京云中融信网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910731048.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:呼叫方法和装置、计算机可读存储介质
- 下一篇:图像处理装置以及记录介质