[发明专利]音乐分离方法、装置及计算机可读存储介质在审
申请号: | 201910008846.2 | 申请日: | 2019-01-04 |
公开(公告)号: | CN109859770A | 公开(公告)日: | 2019-06-07 |
发明(设计)人: | 朱清影;程宁;王健宗 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L21/0272 | 分类号: | G10L21/0272;G10L25/57;G06N3/04;G06N3/08 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及语音语义技术领域,公开了一种音乐分离方法,该方法包括:获取初始样本数据,所述初始样本数据包括多种乐器的初始样本数据,其中一种乐器的初始样本数据包括该种乐器的初始样本声音及该种乐器的初始样本画面;从所述初始样本数据中选取不同种乐器的初始样本数据进行混合,生成混合音频数据作为训练数据,并基于所述训练数据,训练得到分离乐器声音模型。之后,该方法获取输入的待分离的混合音视频,利用训练后的分离乐器声音模型,从所述待分离的混合音视频中分离出同一种乐器的声音及与同一种乐器的声音对应的图像。本发明还提出一种音乐分离装置以及一种计算机可读存储介质。本发明能为音乐家调整视频、音频提供、便利,分离准确且人力资源消耗少。 | ||
搜索关键词: | 样本数据 乐器 计算机可读存储介质 乐器声音 训练数据 视频 混合音 音乐 混合音频数据 人力资源消耗 分离装置 样本画面 样本声音 语义技术 语音 图像 便利 | ||
【主权项】:
1.一种音乐分离方法,其特征在于,所述方法包括:获取初始样本数据,所述初始样本数据包括多种乐器的初始样本数据,其中一种乐器的初始样本数据包括该种乐器的初始样本声音及初始样本画面;从所述初始样本数据中选取不同种乐器的初始样本数据进行混合,生成混合音频数据作为训练数据;基于所述训练数据,训练得到分离乐器声音模型;获取输入的待分离的混合音视频;利用训练后的分离乐器声音模型,从所述待分离的混合音视频中分离出同一种乐器的声音及与同一种乐器的声音对应的图像。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910008846.2/,转载请声明来源钻瓜专利网。