[发明专利]融合视听觉特征的视频表现力识别方法、终端及存储介质在审
申请号: | 201711275404.1 | 申请日: | 2017-12-06 |
公开(公告)号: | CN108307205A | 公开(公告)日: | 2018-07-20 |
发明(设计)人: | 仝小敏;李鹏;吉祥;吴鸽鹏 | 申请(专利权)人: | 中国电子科技集团公司电子科学研究院 |
主分类号: | H04N21/24 | 分类号: | H04N21/24;H04N21/234;H04N21/233;H04N21/81;G06K9/62;G10L25/03;G10L25/57 |
代理公司: | 工业和信息化部电子专利中心 11010 | 代理人: | 于金平 |
地址: | 100041 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 听觉特征 音频特征 计算机可读存储介质 终端 存储介质 视觉特征 视频特征 有效解决 融合 访问量 上传 时长 预设 确定性 | ||
1.一种融合视听觉特征的视频表现力识别方法,其特征在于,包括:
根据预设视频的访问量和上传时长得到视频表现力真值,提取所述视频的视觉特征和音频特征,并将所述视频的视觉特征、音频特征以及该视频对应的视频表现力真值进行训练,得到视频表现力识别模型;
提取待测视频的视觉特征,并提取待测视频的音频特征,将所述视觉特征和音频特征,带入所述视频表现力识别模型得到所述待测视频的视频表现力真值。
2.根据权利要求1所述的方法,其特征在于,
所述预设视频为互联网上的视频广告。
3.根据权利要求1所述的方法,其特征在于,将所述视频和该视频对应的视频表现力真值进行训练,得到视频表现力识别模型,具体包括:
将所述视频和该视频对应的视频表现力真值带入支持向量机SVM进行SVM训练,得到视频表现力识别模型。
4.根据权利要求1所述的方法,其特征在于,
所述视觉特征包括以下中的一种或多种:BoW特征、GIST特征、颜色矩特征和颜色直方图特征。
5.根据权利要求1所述的方法,其特征在于,提取待测视频的音频特征,具体包括:
将待测视频转化为音频格式的音频文件,并对音频文件提取音频特征。
6.根据权利要求5所述的方法,其特征在于,对音频文件提取音频特征,具体包括:
提取音频文件中的节奏、音调、音量和音色信息。
7.一种终端,其特征在于,所述终端包括处理器、存储器及通信总线;
所述通信总线用于实现处理器和存储器之间的连接通信;
所述处理器用于执行存储器中存储的计算机指令,以实现权利要求1至6中任一项所述的融合视听觉特征的视频表现力识别方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现权利要求1至6中的任一项所述的融合视听觉特征的视频表现力识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司电子科学研究院,未经中国电子科技集团公司电子科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711275404.1/1.html,转载请声明来源钻瓜专利网。