[发明专利]一种基于哼唱输入的乐曲合成方法及装置无效
申请号: | 201110437493.1 | 申请日: | 2011-12-23 |
公开(公告)号: | CN102568457A | 公开(公告)日: | 2012-07-11 |
发明(设计)人: | 赵伟峰 | 申请(专利权)人: | 深圳市万兴软件有限公司 |
主分类号: | G10H1/00 | 分类号: | G10H1/00;G10L11/00 |
代理公司: | 广州三环专利代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 哼唱 输入 乐曲 合成 方法 装置 | ||
技术领域
本发明涉及哼唱识别技术领域,尤其涉及一种基于哼唱输入的乐曲合成方法及装置。
背景技术
随着数字音效处理以及音乐呈现技术的进步,音乐创作和保存方式也不断更新。对于专业的音乐人,常常会突发灵感而即兴哼唱,想用某种乐器演奏这段旋律但一时找不到这种乐器;对于没有任何乐理知识的普通人,往往也会在兴致来临时随意哼唱,当他想用某种乐器比如钢琴再现之前哼唱的曲调时,却因为缺乏钢琴演奏技能而无法尽兴。此时,就需要一种能够将接收到的语音信号迅速转换为电子音乐,并模拟任意的指定乐器的演奏效果得到乐曲输出的可随身携带的设备。
目前,人们已经能够通过哼唱识别技术将哼唱的信号改编成音乐乐谱并通过一个简易装置进行回放。
但是现有技术存在下列缺点:哼唱识别的精确度不高;识别算法过于复杂,需要占用较大的系统内存;不能独立完成乐曲的合成,需要输入其它播放器才能进行合成。如在申请号为200610086470.X的专利公开文件中,公开了一种音高跟踪和播放方法和系统,其主要通过在音高检测的预处理时采用两阶低通滤波器进行滤波,隔点进行互相关函数的计算,缩小基音频率的搜索范围等措施达到适用于嵌入式系统的目的,但由于算法精度不够高且较为复杂,依然存在着识别精度低,计算速度慢的缺点。另一方面,这种音高跟踪和播放方法和系统也没能提供独立的乐曲合成功能。
发明内容
本发明实施例所要解决的技术问题在于,提供一种基于哼唱输入的乐曲合成方法及装置,可以实现对哼唱输入的高精度快速识别及合成。
为解决上述问题,本发明实施例提供了一种基于哼唱输入的乐曲合成方法,包括:
根据预设的窗函数对接收到的语音信号进行分帧处理,获得多个对应的语音帧;
对每一语音帧进行静音检测,得到每一语音帧的能量;
对每一语音帧进行滤波处理,并对滤波后的信号进行三电平削波处理,得到每一语音帧对应的削波信号;
对每一语音帧对应的削波信号进行标准自相关计算,根据计算结果提取得到每一语音帧的音高;
根据每一语音帧的能量及音高对所述语音信号进行音符切分,得到切分结果,所述切分结果包括音符、与所述音符一一对应的音符强度及音符时长;
根据用户设置的乐器类型及所述切分结果,合成得到乐曲并输出。
其中,在所述根据预设的窗函数对接收到的语音信号进行分帧处理,获得多个对应的语音帧的步骤,具体包括:
根据预设的窗函数对接收到的语音信号进行分帧处理,获得多个对应的语音帧;
根据预设的帧移长度对每一语音帧进行帧移处理,使所述语音帧相互重叠。
其中,所述对每一语音帧对应的削波信号进行标准自相关计算,根据计算结果提取得到每一语音帧的音高的步骤,具体包括:
A:采用标准自相关函数对所述每一语音帧对应的削波信号进行计算,得到每一语音帧对应的自相关函数,并根据特定的采样率在每一语音帧中选出对应的自相关函数;
B:根据预设的分段值,将选出的当前语音帧的自相关函数均分;
C:分别依次比较当前语音帧中每段自相关函数中的每两个自相关函数值的大小,将每段中值最大的自相关函数值作为峰值,得到当前语音帧的自相关函数峰值序列;
D:记录所述当前语音帧的自相关函数峰值序列中每一峰值所对应的位置信息;
E:对所述当前语音帧的自相关函数峰值序列进行遍历,确定音高位置,将特定采样率及音高位置代入音高计算公式,得到当前语音帧的音高,重复执行所述A至E过程,直至得到每一语音帧的音高。
其中,所述根据每一语音帧的能量及音高对所述语音信号进行音符切分,得到切分结果的步骤,具体包括:
依次比较每一语音帧的能量大小,将能量既大于前两个语音帧又大于后两个语音帧的当前语音帧的能量作为峰值,直至对比到最后一个语音帧,得到整个语音信号的能量峰值序列;
根据所述能量峰值序列中每一个峰值对应的音高,计算得到音符;
根据所述能量峰值序列中每一个峰值,计算得到与所述音符一一对应的音符强度;
根据所述能量峰值序列中每两个峰值之间的时间间隔,得到与所述音符一一对应的音符时长。
其中,所述根据用户设置的乐器类型及所述切分结果,合成得到乐曲并输出的步骤,具体包括:
根据用户设置的乐器类型选择对应的包络曲线,采用频率调制法逼近获得所述乐器演奏所述音符的波形;
将所述波形按照与所述音符一一对应的音符时长依次叠加,合成得到乐曲并输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市万兴软件有限公司,未经深圳市万兴软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110437493.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:记录装置
- 下一篇:制动设备和调节这种制动设备的制动力矩的方法