[发明专利]一种估计录音延迟的方法及终端设备有效
| 申请号: | 201610617671.1 | 申请日: | 2016-07-29 |
| 公开(公告)号: | CN107666638B | 公开(公告)日: | 2019-02-05 |
| 发明(设计)人: | 孔令城 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | H04R3/00 | 分类号: | H04R3/00 |
| 代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
| 地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 估计 录音 延迟 方法 终端设备 | ||
一种估计录音延迟的方法及终端设备,所述方法包括:获取输入的待调整音频,待调整音频包括第一伴奏音频和根据所述第一伴奏音频录制的录音音频;提取第一伴奏音频的第一子指纹序列和录音音频的第二子指纹序列,第一子指纹序列包括至少一个第一子指纹,第二子指纹序列包括至少一个第二子指纹序列;每次分别从第一子指纹序列和第二子指纹序列中选择相同数量的子指纹,根据每次选择的子指纹确定第一子指纹序列和第二子指纹序列的一个相似度,得到多个相似度;根据多个相似度确定第一子指纹序列和第二子指纹序列的匹配度;根据匹配度确定录音音频相对于第一伴奏音频的延迟补偿时长。能够提高计算的精度,相应提高延迟补偿的效果,减少叠音现象。
技术领域
本发明涉及音频处理技术领域,尤其涉及一种估计录音延迟的方法及终端设备。
背景技术
在K歌过程中,在主播端一边播放伴奏、一边采集主播的原唱,录入K歌设备的音频包括主播的原唱和播放的伴奏,K歌设备需要将采集到的原唱和伴奏合成得到最终的演唱音频。但K歌设备在将原唱和伴奏进行合成时,需要保证原唱和伴奏在播放时间点上对齐,否则会出现由于原唱相对伴奏延迟而导致的叠音现象,使得听众听起来,主播总是不在拍子上。为解决叠音的问题,需要进行延迟预测,然后在合成时,通过预测到的延迟值对原唱进行延迟补偿,使原唱和伴奏在播放时间点上保持一致。
目前主要采用能量法、自相关法、轮廓法等基于时域预测的方法对搭载各类操作系统的设备进行延迟补偿,虽然在一定程度上能够减少延迟现象,但抗噪性较差,使得预测到的延迟值并不精准,从而导致延迟补偿效果不理想。
发明内容
本发明提供了一种估计录音延迟的方法及终端设备,能够解决现有技术中录音延迟补偿的效果较差的问题。
第一方面提供一种估计录音延迟的方法,所述方法包括:
获取输入的待调整音频,所述待调整音频包括第一伴奏音频和根据所述第一伴奏音频录制的录音音频;
提取所述第一伴奏音频的第一子指纹序列和所述录音音频的第二子指纹序列,所述第一子指纹序列包括至少一个第一子指纹,所述第二子指纹序列包括至少一个第二子指纹序列;
每次分别从所述第一子指纹序列和所述第二子指纹序列中选择相同数量的子指纹,根据每次选择的子指纹确定所述第一子指纹序列和所述第二子指纹序列的一个相似度,得到多个相似度;
根据所述多个相似度确定所述第一子指纹序列和所述第二子指纹序列的匹配度;
根据所述匹配度确定所述录音音频相对于所述第一伴奏音频的延迟补偿时长。
本发明第二方面提供一种终端设备,所述终端设备包括:
获取模块,用于获取输入的待调整音频,所述待调整音频包括第一伴奏音频和根据所述第一伴奏音频录制的录音音频;
指纹提取模块,用于提取所述第一伴奏音频的第一子指纹序列和所述录音音频的第二子指纹序列,所述第一子指纹序列包括至少一个第一子指纹,所述第二子指纹序列包括至少一个第二子指纹序列;
处理模块,用于每次分别从所述指纹提取模块提取的所述第一子指纹序列和所述第二子指纹序列中选择相同数量的子指纹,根据每次选择的子指纹确定所述第一子指纹序列和所述第二子指纹序列的一个相似度,得到多个相似度;
根据所述多个相似度确定所述第一子指纹序列和所述第二子指纹序列的匹配度;
根据所述匹配度确定所述录音音频相对于所述第一伴奏音频的延迟补偿时长。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610617671.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电影院使用的配电箱
- 下一篇:感知功率减小系统和方法





