[发明专利]获取基音波形数据的方法和装置在审
申请号: | 201711337024.6 | 申请日: | 2017-12-12 |
公开(公告)号: | CN107958672A | 公开(公告)日: | 2018-04-24 |
发明(设计)人: | 肖纯智 | 申请(专利权)人: | 广州酷狗计算机科技有限公司 |
主分类号: | G10L25/18 | 分类号: | G10L25/18;G10L21/003;G10L25/27 |
代理公司: | 北京三高永信知识产权代理有限责任公司11138 | 代理人: | 郭晶 |
地址: | 510660 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 获取 基音 波形 数据 方法 装置 | ||
技术领域
本公开是关于音频技术领域,尤其是关于一种获取基音波形数据的方法和装置
背景技术
随着人们生活节奏的加快,唱歌已经成为人们放松心情的常用娱乐休闲方式之一,对于经常唱跑调的用户可以使用多媒体设备对其音调进行调整,以接近相应歌曲的标准音高数据。通常多媒体设备中预先储存有歌曲的标准音高数据,多媒体设备可以基于该标准音高数据对采集到的用户歌唱的人声音频的音调进行调整。
声音是由振动产生的,包括基音的振动和泛音的振动,而音调由基音的振动决定的。因此改变音调的关键在于获取人声音频的基音,根据基音的振动情况和标准音高数据的对比,对人声音频进行调节,进而实现人声音频的变音调不变音色。因此,变音调的关键在于准确获取基音的振动情况,现有技术中,通常使用带通滤波器对音频进行时域滤波,其中,通带的频率范围设置为一般的人声音频的基音的频率范围。
在实现本公开的过程中,发明人发现至少存在以下问题:
一首完整的歌曲其基音的频率波动较大,例如,在初始阶段基音的频率较低,在中间阶段高潮阶段基音的频率较高,这样,带通滤波器的通带的频率范围必须设置足够宽,才能覆盖所有基音的频率,但是这样也会覆盖部分泛音的频率,这样不能准确得到基音的振动情况。
发明内容
为了克服相关技术中存在的问题,本公开提供了一种获取基音波形数据的方法和装置。所述技术方案如下:
根据本公开实施例,提供一种获取基音波形数据的方法,所述方法包括:
对目标音频中每个音频帧进行音高提取,得到每个音频帧对应的目标频率;
对于每个音频帧,基于所述音频帧对应的目标频率,在所述音频帧的频谱数据中,确定对应的目标振幅;
基于每个音频帧对应的目标振幅和目标频率,确定所述目标音频的基音波形数据。
可选的,所述对于每个音频帧,基于所述音频帧对应的目标频率,在所述音频帧的频谱数据中,确定对应的目标振幅,包括:
对每个音频帧的音频波形数据,分别进行傅里叶变换,得到每个音频帧的频谱数据;
在每个音频帧的频谱数据中,确定目标频率对应的目标振幅。
可选的,所述基于每个音频帧对应的目标振幅和目标频率,确定所述目标音频的基音波形数据,包括:
在每个音频帧的频谱数据中,保持目标频率对应的目标振幅不变,并将其它频率对应的振幅置零,得到每个音频帧的调整后的频谱数据;
对每个音频帧的调整后的频谱数据进行傅里叶逆变换,得到所述目标音频的基音波形数据。
可选的,所述基于每个音频帧对应的目标振幅和目标频率,确定所述目标音频的基音波形数据,包括:
基于每个音频帧对应的目标振幅和目标频率,分别生成每个音频帧的调整后的频谱数据;
对每个音频帧的调整后的频谱数据进行傅里叶逆变换,得到所述目标音频的基音波形数据。
可选的,所述方法还包括:
基于所述目标音频的基音波形数据、预先储存的与所述目标音频相对应的标准音高数据,对所述目标音频进行音调调整。
根据本公开实施例,提供一种音频处理的方法,所述方法包括:
将上述所述的基音波形数据中每个周期对应的频率值,分别与标准音高数据中在时间上相对应的标准频率值进行比较,如果频率值与标准频率值之差的绝对值大于预设数值,则对所述频率值所在周期的目标音频进行调整。
根据本公开实施例,提供一种获取基音波形数据的装置,所述装置包括:
提取模块,用于对目标音频中每个音频帧进行音高提取,得到每个音频帧对应的目标频率;
第一确定模块,用于对于每个音频帧,基于所述音频帧对应的目标频率,在所述音频帧的频谱数据中,确定对应的目标振幅;
第二确定模块,用于基于每个音频帧对应的目标振幅和目标频率,确定所述目标音频的基音波形数据。
可选的,所述第一确定模块,具体用于:
对每个音频帧的音频波形数据,分别进行傅里叶变换,得到每个音频帧的频谱数据;
在每个音频帧的频谱数据中,确定目标频率对应的目标振幅。
可选的,所述第二确定模块,具体用于:
在每个音频帧的频谱数据中,保持目标频率对应的目标振幅不变,并将其它频率对应的振幅置零,得到每个音频帧的调整后的频谱数据;
对每个音频帧的调整后的频谱数据进行傅里叶逆变换,得到所述目标音频的基音波形数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州酷狗计算机科技有限公司,未经广州酷狗计算机科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711337024.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种执法记录仪的回声消除装置
- 下一篇:一种口语评分方法及装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置