[发明专利]一种合成音乐的方法和装置有效
申请号: | 202010598390.2 | 申请日: | 2020-06-28 |
公开(公告)号: | CN111724764B | 公开(公告)日: | 2023-01-03 |
发明(设计)人: | 张晴晴;贾艳明;张雪璐;岑吴镕 | 申请(专利权)人: | 北京爱数智慧科技有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10H7/00 |
代理公司: | 北京智沃律师事务所 11620 | 代理人: | 吴志宏 |
地址: | 100044 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 合成 音乐 方法 装置 | ||
本发明公开一种合成音乐的方法和装置,该方法包括以下步骤:获取用户输入的目标乐器的乐谱信息,将所述目标乐器的乐谱信息分解为所述目标乐器的乐谱音节;将所述目标乐器的乐谱音节转换为对应的统一基础音节;根据所述统一基础音节和用户选择的音乐风格,生成对应的音乐文件。本发明能够基于用户录入的乐谱信息(例如,古筝谱)以及选择的音乐风格(例如,郎朗风格),生成相应的音乐文件,帮助没有音乐基础的用户参与到音乐制作中,从而满足用户合成音乐的需求。
技术领域
本发明涉及音频技术领域,特别涉及一种合成音乐的方法和装置。
背景技术
TTS(Text To Speech,从文本到语音)技术是人机对话的一部分,是同时运用语言学和心理学的杰出之作,在内置芯片的支持之下,通过神经网络的设计,把文字智能地转化为自然语音流。TTS技术对文本文件进行实时转换,转换时间之短可以秒计算。在其特有智能语音控制器作用下,文本输出的语音音律流畅,使得听者在听取信息时感觉自然,毫无机器语音输出的冷漠与生涩感。TTS技术即将覆盖国标一、二级汉字,具有英文接口,自动识别中、英文,支持中英文混读。所有声音采用真人普通话为标准发音,实现了120-150个汉字/分钟的快速语音合成,朗读速度达3-4个汉字/秒,使用户可以听到清晰悦耳的音质和连贯流畅的语调。TTS技术作为语音合成应用的一种,能够将储存于电脑中的文件,如帮助文件或者网页,转换成自然语音输出。TTS技术不仅能帮助有视觉障碍的人阅读计算机上的信息,更能增加文本文档的可读性。TTS应用包括语音驱动的邮件以及声音敏感系统,并常与声音识别程序一起使用。
然而,现有的TTS技术无法将乐谱信息转换为对应的音乐文件,无法满足用户制作音乐的需求。
发明内容
本发明提供了一种合成音乐的方法和装置,以解决现有技术无法满足用户制作音乐的需求的缺陷。
本发明提供了一种合成音乐的方法,包括以下步骤:
获取用户输入的目标乐器的乐谱信息,将所述目标乐器的乐谱信息分解为所述目标乐器的乐谱音节;
将所述目标乐器的乐谱音节转换为对应的统一基础音节;
根据所述统一基础音节和用户选择的音乐风格,生成对应的音乐文件。
可选地,所述的方法,还包括:
生成统一基础音节对应关系表;
所述将所述目标乐器的乐谱音节转换为对应的统一基础音节,包括:
根据所述目标乐器的乐谱音节,查询所述统一基础音节对应关系表,得到与所述目标乐器的乐谱音节对应的统一基础音节;
其中,所述统一基础音节对应关系表包括多种乐器的所有乐谱音节与统一基础音节的对应关系,所述多种乐器包括目标乐器。
可选地,所述生成统一基础音节对应关系表,包括:
统计多种乐器的发音规则,画出梅尔频谱,并获取多种乐器的所有乐谱音节在梅尔频谱上的位置;
按照距离统计分布,对多种乐器的所有乐谱音节在梅尔频谱上的位置进行归类,将距离相近的乐谱音节归为同一类,并确定与同一类乐谱音节对应的统一基础音节;
根据多种乐器的所有乐谱音节与统一基础音节的对应关系,生成统一基础音节对应关系表。
可选地,所述的方法,还包括:
生成音乐风格模型;
所述根据所述统一基础音节和用户选择的音乐风格,生成对应的音乐文件,包括:
将所述统一基础音节和用户选择的音乐风格输入到所述音乐风格模型,获取所述音乐风格模型输出的音乐文件。
可选地,所述生成音乐风格模型,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京爱数智慧科技有限公司,未经北京爱数智慧科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010598390.2/2.html,转载请声明来源钻瓜专利网。