[发明专利]一种基于情感显著性特征融合的视频情感识别方法有效

专利信息
申请号: 201510534693.7 申请日: 2015-08-27
公开(公告)号: CN105138991B 公开(公告)日: 2016-08-31
发明(设计)人: 丁昕苗;郭文;朱智林;王永强;华甄;刘延武 申请(专利权)人: 山东工商学院
主分类号: G06K9/00 分类号: G06K9/00;G06K9/62
代理公司: 济南圣达知识产权代理有限公司 37221 代理人: 张勇
地址: 264026 山东*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于情感显著性特征融合的视频情感识别方法,获得训练视频集合并对其中的视频提取视频镜头,对每个视频镜头选取情感关键帧;对训练视频集合中每个视频镜头提取音频特征和视觉情感特征,音频特征基于词包模型构成情感分布直方图特征;视觉情感特征基于视觉词典构成情感注意力特征,情感注意力特征与情感分布直方图特征进行自上而下的融合,构成具有情感显著性的视频特征;将训练视频集合中形成的具有情感显著性的视频特征送入SVM分类器进行训练,得到训练模型的参数,训练模型用于对测试视频的情感类别进行预测。本发明的融合算法实现简单,训练器成熟可靠,预测快捷,可以更高效的完成视频的情感识别过程。
搜索关键词: 一种 基于 情感 显著 特征 融合 视频 识别 方法
【主权项】:
一种基于情感显著性特征融合的视频情感识别方法,其特征是,包括以下步骤:获得训练视频集合并对其中的视频提取视频镜头,对每个视频镜头选取情感关键帧;对训练视频集合中每个视频镜头提取音频特征和视觉情感特征,其中视觉情感特征基于所提取的情感关键帧提取,音频特征基于视频镜头提取;音频特征基于词包模型构成情感分布直方图特征;视觉情感特征基于视觉词典构成情感注意力特征,情感注意力特征与情感分布直方图特征进行自上而下的加权融合,构成具有情感显著性的视频特征;将训练视频集合中形成的具有情感显著性的视频特征送入SVM分类器进行训练,得到训练模型的参数,训练模型用于对测试视频的情感类别进行预测;情感注意力特征的构成方式为:将每个视频的视觉情感特征同样进行k近邻聚类,得到N个聚类中心,并由此N个聚类中心作为视觉单词组成视觉情感词典;将视频的视觉情感特征投影到视觉情感词典,按视频情感类别分别得到每个类别对应的视觉情感单词的后验概率分布,即得到各情感类别的情感注意力特征;视觉情感单词的后验概率分布计算如下:<mrow><mi>p</mi><mrow><mo>(</mo><mi>c</mi><mi>l</mi><mi>a</mi><mi>s</mi><mi>s</mi><mo>|</mo><msubsup><mi>w</mi><mi>j</mi><mrow><mi>v</mi><mi>i</mi><mi>s</mi></mrow></msubsup><mo>)</mo></mrow><mi>&infin;</mi><mi>p</mi><mrow><mo>(</mo><msubsup><mi>w</mi><mi>j</mi><mrow><mi>v</mi><mi>i</mi><mi>s</mi></mrow></msubsup><mo>|</mo><mi>c</mi><mi>l</mi><mi>a</mi><mi>s</mi><mi>s</mi><mo>)</mo></mrow><mi>p</mi><mrow><mo>(</mo><mi>c</mi><mi>l</mi><mi>a</mi><mi>s</mi><mi>s</mi><mo>)</mo></mrow></mrow>其中,为视觉情感单词的后验概率分布,class为视频情感类别,为视觉词典的第j个视觉情感单词;p(class)为类别class的情感视频概率分布,通过统计该类别情感视频占总视频的比例得到;是类别为class的视觉情感词典的第j个视觉情感单词的分布,根据下式获得:<mrow><mi>p</mi><mrow><mo>(</mo><msubsup><mi>w</mi><mi>j</mi><mrow><mi>v</mi><mi>i</mi><mi>s</mi></mrow></msubsup><mo>|</mo><mi>c</mi><mi>l</mi><mi>a</mi><mi>s</mi><mi>s</mi><mo>)</mo></mrow><mi>&infin;</mi><munder><mo>&Sigma;</mo><mrow><msup><mi>Scene</mi><mrow><mi>c</mi><mi>l</mi><mi>a</mi><mi>s</mi><mi>s</mi></mrow></msup></mrow></munder><munder><mo>&Sigma;</mo><mrow><mi>l</mi><mo>&Element;</mo><mi>D</mi></mrow></munder><mi>&delta;</mi><mrow><mo>(</mo><msubsup><mi>w</mi><mi>l</mi><mrow><mi>v</mi><mi>i</mi><mi>s</mi></mrow></msubsup><mo>,</mo><msubsup><mi>w</mi><mi>j</mi><mrow><mi>v</mi><mi>i</mi><mi>s</mi></mrow></msubsup><mo>)</mo></mrow></mrow>其中,Sceneclass是类别为class的视频场景数,D是类别为class的视频情感词典所含单词数,是类别为class的场景所包含的第l个视觉单词,δ为符号函数,其定义为:x,y为符号函数δ的输入变量。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东工商学院,未经山东工商学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201510534693.7/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top