[发明专利]基于Gamma分布分析的音乐连续情感特征分析评价方法有效

申请号：	201710791753.2	申请日：	2017-09-05
公开（公告）号：	CN107578785B	公开（公告）日：	2020-08-14
发明（设计）人：	李海峰;马琳;薄洪健;丰上;李洪伟;刘全胜;信家男	申请（专利权）人：	哈尔滨工业大学;深圳航天科技创新研究院
主分类号：	G10L25/63	分类号：	G10L25/63
代理公司：	哈尔滨市哈科专利事务所有限责任公司 23101	代理人：	吴振刚
地址：	150001 黑龙江省哈尔滨市***	国省代码：	黑龙江;23
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提供一种基于Gamma分布分析的音乐连续情感特征分析评价方法，首先建立音乐连续情感特征的Gamma分布分析评价方法，通过该方法在时序上找到与情感响应最相似的情感特征。其次，建立基于情感感知矩阵的情感特征分析方法，通过该方法从情感感知能力上对上述特征进行评价，找到感知能力最好的情感特征。最后基于Gamma分布的情感预测方法，实现音乐情感的实时、自动分析。本方法可对音乐情感自动分析，情感标签实时自动预测，为音乐情感的评价和选择提供依据，对人工智能、情绪感知等方面具有推动作用。
搜索关键词：	基于 gamma 分布分析音乐连续情感特征评价方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于Gamma分布分析的音乐连续情感特征分析评价方法，其特征在于，具体步骤如下：步骤一：计算音乐特征和情感标签之间的相关性；设音乐信号为Ai,1≤i≤N，N为样本个数，在用户听音乐的过程中的Valence和Arousal情感标签为L，其采样率为2Hz，(1)首先对音乐信号进行加窗、分帧，音乐情感分析长度取窗长w为4秒，帧移为0.5秒；(2)其次，音频特征提取，设特征Fij,1≤j≤M，M为特征维数，提取音高、响度等音乐底层特征，以及旋律、节奏等高层语义特征；(3)计算每一维特征Fij与打分L的Pearson相关系数，得到Pearson相关系数矩阵R，计算公式如下：rij=cov(Li,Fij)σLiσFij]]>步骤二：基于Gamma分布的特征筛选方法；由于相关系数是从0到1之间，且分布离1越近表示相关性大，分布离0越近表示相关性小，因此进行两次Gamma分布拟合去掉相关性小的，保留相关性较大的特征，(1)首先，计算每一维特征在所有样本上相关系数的直方图；(2)其次，对相关系数直方图进行Gamma分布拟合，在这里特定特征的相关系数为ri,i＝1,2,…,n,其中n为样本个数，先对相关系数直方图进行Gamma分布拟合，根据Gamma分布的定义，得到概率密度函数拟合公式如下：f(r)=r(α-1)λαe-λXΓ(α),r>0]]>其中α为Gamma分布的形状参数，决定Gamma分布的陡峭程度，λ＝1/β为Gamma分布的尺度参数，决定Gamma分布的散布程度；(3)再对相关系数直方图进行轴对称操作，即对轴对称后的相关系数直方图进行Gamma分布分析，得到拟合参数和(4)根据两次Gamma拟合的参数构造相关性影响因子IF：IF=βα]]>对所有特征按IF从大到小排序，筛选出前K个最相关特征构成特征子集Fs,s＝1,…,K；步骤三：建立情感感知概率矩阵EDM(1)建立特征相似度矩阵FDM首先对上一步筛选出的K维特征及情感打分进行分帧，取帧长为4秒，帧移为3秒，对情感特征的每一帧和对应的情感打分构建N×N的相似度矩阵FDM，构建方法如下：设第t帧样本为A1,A2,…,AN，且顺序确定，其特征为F1,F2,…,FK，则：FDMpg＝dist(Fpk,Fqk),1≤p,q≤N其中Fik表示第i个样本的第k维特征的特征向量，表示X和Y的欧式距离，经过这一步计算，得到K个特征相似度矩阵FDMi,i＝1,…,K。同样方法，设第t帧样本对应的打分为L1,L2,…,LK，对打分也求得一个相似度矩阵LDM；LDMpg＝dist(Lp,Lq),1≤p,q≤N(2)情感感知概率矩阵EDM为了衡量相应的特征差异，对每一帧的FDMi和LDM计算矩阵相似度作，计算方法如下：ρk=cov(LDM,FDMk)σLDMσFDMk]]>ρk′=ρk-min(ρk)max(ρk)-min(ρk)]]>那么，在T帧中，用每一帧都用如上方法计算特征差异概率，并归一化，就构成了情感感知概率矩阵EDM，计算方法如下：EDMtk＝ρ′k(t)步骤四：计算情感变化最长路径，构造回归预测模型对维度情感进行预测；(1)情感最大路径计算方法在T帧中，用每一帧的特征矩阵与概率矩阵EDM相乘，构成新的情感特征矩阵FDM‘，在情感特征矩阵中，用最大权值路径作为特征向量，求解最大权值路径的问题，转化为求子问题的最优解，使用动态规划算法，记录了已求解过的子问题结果，设Pathi,j是对矩阵的描述，则其状态转移方程写为：MPi,j＝max{MPi‑1,j,MPi,j+1}+MPi,j其中MPi,j表示走到第i行第j列的最大权值，那么MPi,j的最优解包含子问题MPi‑1,j和MPi,j+1的最优解，其中MP0,n‑1＝Path0,n‑1，最大的路径权值通过比较底层的分数求得；(2)基于Lasso回归的音乐连续情感预测方法首先，在前面特征选择的基础上，设最优特征集为Fk,k＝1,2,…,K，在最优特征集上，分别对Valence和Arousal建立回归预测方程：Y＝Xβ+μ其中X为特征集，Y为Valence或Arousal的平均打分，μ为随机误差项；其次，基于Lasso回归模型，对预测方程进行求解，求得取得最小时的拟合系数；β^=argmin{(y-FKβ)2+λ|β|}]]>在求解拟合系数时，约束条件取最小的λ或SE值，取最小值为约束条件；最后，在最优拟合系数的基础上对新的未知样本经行Valence和Arousal的预测。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学;深圳航天科技创新研究院，未经哈尔滨工业大学;深圳航天科技创新研究院许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201710791753.2/，转载请声明来源钻瓜专利网。

上一篇：一种从音频中提取目标源的方法及装置
下一篇：一种光盘存储和分盘装置

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于Gamma分布分析的音乐连续情感特征分析评价方法有效

专利文献下载