[发明专利]一种基于多特征融合策略的音乐生成舞蹈姿势方法在审
申请号: | 202210458956.0 | 申请日: | 2022-04-27 |
公开(公告)号: | CN114998984A | 公开(公告)日: | 2022-09-02 |
发明(设计)人: | 俞文心;高宇飞;刘宇欣;吴筱迪;龚俊;刘畅 | 申请(专利权)人: | 西南科技大学 |
主分类号: | G06V40/20 | 分类号: | G06V40/20;G06K9/62;G06N3/04;G06N3/08;G10L21/10;G06V10/77;G06V10/80;G06V10/82 |
代理公司: | 成都帝鹏知识产权代理事务所(普通合伙) 51265 | 代理人: | 罗旭 |
地址: | 62100*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 特征 融合 策略 音乐 生成 舞蹈 姿势 方法 | ||
本发明公开一种基于多特征融合策略的音乐生成舞蹈姿势方法,包括步骤:特征提取:将音频文件进行预处理获得音频序列,将音频序列转化为特征数据,特征数据由结构特征、节拍特征和风格特征构成;特征融合:将结构特征、节拍特征和风格特征进行融合,得到音乐特征表示;姿态生成:将音乐特征表示输入姿态生成器获得舞蹈姿态。本发明能够提高动作与音乐在风格和节奏上协调性,提高了舞蹈动作的丰富性。
技术领域
本发明属于计算机舞蹈编排技术领域,特别是涉及一种基于多特征融合策略的音乐生成舞蹈姿势方法。
背景技术
音乐处理技术和动作捕捉技术的不断发展,基于音乐的舞蹈动作合成技术逐渐成为音乐理解和舞蹈合成领域的研究热点,而如何提高音乐和舞蹈的匹配以及合成舞蹈的真实性是研究的关键点。
统计模型是这类任务最早的工作,比如基于核的概率分布来合成动作,缺点是缺少动作细节;动作图以一个非参的方式解决了缺少动作细节的问题,动作图是一个动作数据集上的有向图,每个节点表示一个姿势,每条边表示两个姿势之间的过渡,通过随机在图上游走来生成动作,缺点是生成的过渡的合理性,一些方法通过参数化过渡来解决这个问题。基于核的概率分布的方法,缺乏动作细节,变现为动作极度僵硬;动作图的方法把问题转化为在图上寻找最优路径,通过一个非参的方式解决了缺乏动作细节的问题,并且在动作图里加入节拍信息可以合成有节奏的动作,但是动作之间合理的过渡比较困难,动作之间不连贯,表现为像多段动作的拼接。
现在更多的是使用神经网络来生成3D动作,像RNN这样的自回归模型理论上可以生成无穷的动作,由于其本身具有错位累积的问题,在几轮迭代后出现动作僵直、漂移等不自然现象。分阶段的神经网络和它的变体通过在每个阶段调整网络权重解决了这个问题。虽然,分阶段训练网络通过阶段性地调整网络权重来使僵直问题得到缓和;但是它不能表示很多种类的动作,表示的动作丰富性欠缺,动作与音乐在风格和节奏上协调的也不是很理想。
发明内容
为了解决上述问题,本发明提出了一种基于多特征融合策略的音乐生成舞蹈姿势方法,提高动作与音乐在风格和节奏上协调性,提高了舞蹈动作的丰富性。
为达到上述目的,本发明采用的技术方案是:一种基于多特征融合策略的音乐生成舞蹈姿势方法,包括步骤:
特征提取:将音频文件进行预处理获得音频序列,将音频序列转化为特征数据,特征数据由结构特征、节拍特征和风格特征构成;
特征融合:将结构特征、节拍特征和风格特征进行融合,得到音乐特征表示;
姿态生成:将音乐特征表示输入姿态生成器获得舞蹈姿态。
进一步的是,将音频文件进行预处理获得音频序列,包括步骤:
对音频文件仅采样获得表示波形的一维数组;
对一维数组进行切分,获得每帧对应时长的音频单元;
对所获得的多个音频单元进行组合获得音频序列。
进一步的是,所述特征提取过程由结构提取器、风格提取器和节拍提取器构成;
所述结构提取器提取结构特征向量,节拍提取器提取节拍特征向量,风格提取器提取风格特征向量,最后将得到的三组特征向量进行拼接作为表示音乐的特征向量。
进一步的是,所述结构提取器,由一个音频编码器对音乐文件编码,编码后得到的向量经过LSTM网络之后使用注意力机制处理来得到结构特征向量。
进一步的是,所述风格提取器,由一个音频编码器对音乐文件编码,对编码后的向量直接使用预训练的音乐风格提取器提取风格特征,得到风格特征向量。
进一步的是,所述节拍提取器,使用开源工具提取,获得节拍特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南科技大学,未经西南科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210458956.0/2.html,转载请声明来源钻瓜专利网。