[发明专利]基于Gamma分布分析的音乐连续情感特征分析评价方法有效
申请号: | 201710791753.2 | 申请日: | 2017-09-05 |
公开(公告)号: | CN107578785B | 公开(公告)日: | 2020-08-14 |
发明(设计)人: | 李海峰;马琳;薄洪健;丰上;李洪伟;刘全胜;信家男 | 申请(专利权)人: | 哈尔滨工业大学;深圳航天科技创新研究院 |
主分类号: | G10L25/63 | 分类号: | G10L25/63 |
代理公司: | 哈尔滨市哈科专利事务所有限责任公司 23101 | 代理人: | 吴振刚 |
地址: | 150001 黑龙江省哈尔滨市*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种基于Gamma分布分析的音乐连续情感特征分析评价方法,首先建立音乐连续情感特征的Gamma分布分析评价方法,通过该方法在时序上找到与情感响应最相似的情感特征。其次,建立基于情感感知矩阵的情感特征分析方法,通过该方法从情感感知能力上对上述特征进行评价,找到感知能力最好的情感特征。最后基于Gamma分布的情感预测方法,实现音乐情感的实时、自动分析。本方法可对音乐情感自动分析,情感标签实时自动预测,为音乐情感的评价和选择提供依据,对人工智能、情绪感知等方面具有推动作用。 | ||
搜索关键词: | 基于 gamma 分布 分析 音乐 连续 情感 特征 评价 方法 | ||
【主权项】:
一种基于Gamma分布分析的音乐连续情感特征分析评价方法,其特征在于,具体步骤如下:步骤一:计算音乐特征和情感标签之间的相关性;设音乐信号为Ai,1≤i≤N,N为样本个数,在用户听音乐的过程中的Valence和Arousal情感标签为L,其采样率为2Hz,(1)首先对音乐信号进行加窗、分帧,音乐情感分析长度取窗长w为4秒,帧移为0.5秒;(2)其次,音频特征提取,设特征Fij,1≤j≤M,M为特征维数,提取音高、响度等音乐底层特征,以及旋律、节奏等高层语义特征;(3)计算每一维特征Fij与打分L的Pearson相关系数,得到Pearson相关系数矩阵R,计算公式如下:rij=cov(Li,Fij)σLiσFij]]>步骤二:基于Gamma分布的特征筛选方法;由于相关系数是从0到1之间,且分布离1越近表示相关性大,分布离0越近表示相关性小,因此进行两次Gamma分布拟合去掉相关性小的,保留相关性较大的特征,(1)首先,计算每一维特征在所有样本上相关系数的直方图;(2)其次,对相关系数直方图进行Gamma分布拟合,在这里特定特征的相关系数为ri,i=1,2,…,n,其中n为样本个数,先对相关系数直方图进行Gamma分布拟合,根据Gamma分布的定义,得到概率密度函数拟合公式如下:f(r)=r(α-1)λαe-λXΓ(α),r>0]]>其中α为Gamma分布的形状参数,决定Gamma分布的陡峭程度,λ=1/β为Gamma分布的尺度参数,决定Gamma分布的散布程度;(3)再对相关系数直方图进行轴对称操作,即对轴对称后的相关系数直方图进行Gamma分布分析,得到拟合参数和(4)根据两次Gamma拟合的参数构造相关性影响因子IF:IF=βα]]>对所有特征按IF从大到小排序,筛选出前K个最相关特征构成特征子集Fs,s=1,…,K;步骤三:建立情感感知概率矩阵EDM(1)建立特征相似度矩阵FDM首先对上一步筛选出的K维特征及情感打分进行分帧,取帧长为4秒,帧移为3秒,对情感特征的每一帧和对应的情感打分构建N×N的相似度矩阵FDM,构建方法如下:设第t帧样本为A1,A2,…,AN,且顺序确定,其特征为F1,F2,…,FK,则:FDMpg=dist(Fpk,Fqk),1≤p,q≤N其中Fik表示第i个样本的第k维特征的特征向量,表示X和Y的欧式距离,经过这一步计算,得到K个特征相似度矩阵FDMi,i=1,…,K。同样方法,设第t帧样本对应的打分为L1,L2,…,LK,对打分也求得一个相似度矩阵LDM;LDMpg=dist(Lp,Lq),1≤p,q≤N(2)情感感知概率矩阵EDM为了衡量相应的特征差异,对每一帧的FDMi和LDM计算矩阵相似度作,计算方法如下:ρk=cov(LDM,FDMk)σLDMσFDMk]]>ρk′=ρk-min(ρk)max(ρk)-min(ρk)]]>那么,在T帧中,用每一帧都用如上方法计算特征差异概率,并归一化,就构成了情感感知概率矩阵EDM,计算方法如下:EDMtk=ρ′k(t)步骤四:计算情感变化最长路径,构造回归预测模型对维度情感进行预测;(1)情感最大路径计算方法在T帧中,用每一帧的特征矩阵与概率矩阵EDM相乘,构成新的情感特征矩阵FDM‘,在情感特征矩阵中,用最大权值路径作为特征向量,求解最大权值路径的问题,转化为求子问题的最优解,使用动态规划算法,记录了已求解过的子问题结果,设Pathi,j是对矩阵的描述,则其状态转移方程写为:MPi,j=max{MPi‑1,j,MPi,j+1}+MPi,j其中MPi,j表示走到第i行第j列的最大权值,那么MPi,j的最优解包含子问题MPi‑1,j和MPi,j+1的最优解,其中MP0,n‑1=Path0,n‑1,最大的路径权值通过比较底层的分数求得;(2)基于Lasso回归的音乐连续情感预测方法首先,在前面特征选择的基础上,设最优特征集为Fk,k=1,2,…,K,在最优特征集上,分别对Valence和Arousal建立回归预测方程:Y=Xβ+μ其中X为特征集,Y为Valence或Arousal的平均打分,μ为随机误差项;其次,基于Lasso回归模型,对预测方程进行求解,求得取得最小时的拟合系数;β^=argmin{(y-FKβ)2+λ|β|}]]>在求解拟合系数时,约束条件取最小的λ或SE值,取最小值为约束条件;最后,在最优拟合系数的基础上对新的未知样本经行Valence和Arousal的预测。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学;深圳航天科技创新研究院,未经哈尔滨工业大学;深圳航天科技创新研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710791753.2/,转载请声明来源钻瓜专利网。
- 上一篇:一种从音频中提取目标源的方法及装置
- 下一篇:一种光盘存储和分盘装置