[发明专利]一种基于多源信息融合分析的网络视频热点事件发现方法有效
申请号: | 201610109051.7 | 申请日: | 2016-02-26 |
公开(公告)号: | CN105787049B | 公开(公告)日: | 2019-07-16 |
发明(设计)人: | 宋明黎;王灿;雷杰;张珂瑶;周星辰;卜佳俊 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F16/78 | 分类号: | G06F16/78;G06F16/738;G06F16/36;G06K9/62 |
代理公司: | 杭州天正专利事务所有限公司 33201 | 代理人: | 王兵;黄美娟 |
地址: | 310027 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 信息 融合 分析 网络 视频 热点 事件 发现 方法 | ||
1.一种基于多源信息融合分析的网络视频热点事件发现方法,
包括如下步骤:
1)采集有多源信息的网络视频;
2)通过多源融合分析的视频语义结构化模块,将网络视频的多源信息结构化为描述性关键字标签,实现网络视频语义结构化;
3)根据步骤2)得到的网络视频语义结构化关键字标签与用户定义的敏感词字典的匹配度,得到网络视频的主观敏感度参数;
4)根据网络视频中多源信息中的点击率、时间字段,得到网络视频的客观热度参数;
5)根据步骤3)得到的主观敏感度参数,建立网络视频敏感度预测模型,预测新网络视频的主观敏感度;
6)根据步骤4)得到的客观热度参数,建立网络视频热度预测模型,预测新网络视频的客观热度;
7)选取步骤5)得到的网络视频的主观敏感度和步骤6)得到的网络视频的客观热度都大于一定阈值,并且主观敏感度和客观热度加权求和在网络视频集中排名靠前的视频作为热点视频,即网络视频热点事件。
2.根据权利要求1所述的一种基于多源信息融合分析的网络视频热点事件发现方法,其特征在于:步骤1所述的多源信息包括网络视频的标签、名称、评论、时间和点击率。
3.根据权利要求1所述的一种基于多源信息融合分析的网络视频热点事件发现方法,其特征在于:步骤2所述的多源融合分析的视频语义结构化模块,用于视频摘要下载与多源文本信息摘要提取、视频概念检测与文本主题建模和视频语义结构化。
4.根据权利要求3所述的一种基于多源信息融合分析的网络视频热点事件发现方法,其特征在于:所述的视频摘要下载与多源文本信息摘要提取 一方面是指基于已有标注的训练数据,通过视频特征估计视频中前景物体,然后用Gibbs采样学习该前景在时间轴上的分布,从而计算前景在时域上对表现视频内容的似然分布;当给定新的网络视频时,通过前景检测获得前景的起始时间,然后基于学习得到的时域似然分布,在最大似然的同时最小化视频帧的数目,从而获得对该视频的摘要提取;另一方面,将非结构化的语义脚本进行信息摘要提取 ,用几句话概括原本冗长的文字脚本;对此,采用课题组研发的基于语义重建的文本摘要技术,通过训练文本的语义重建训练获得常用关键词字典;给定新的文本数据时,基于训练得到的关键词字典对该文本数据进行语义重建,从而实现原始多源文本的摘要提取 ;系统通过时刻保持对视频摘要数据和文本摘要数据的协同以获得多源数据流摘要提取 之后的一致性。
5.根据权利要求3所述的一种基于多源信息融合分析的网络视频热点事件发现方法,其特征在于:所述的视频概念检测与文本主题建模是指将摘要下载的网络视频和与之匹配的文字脚本建模为语义单元的集合描述,以便于后续步骤对视频和文本内容的结构化理解;具体包括首先构造视频低层特征与视频概念的支持向量机SVM判别式模型,基于大量的网络视频标注数据对各种视频概念检测SVM进行训练;通过视频概念检测,可以排除大部分无用的视频信息,关注于视频中语义概念集中的部分,实现视频的语义概念描述;然后,文本主题建模模块采用隐狄利克雷话题模型LDTM,利用期望最大化算法得到模型的参数;将每个文本脚本表示成混合话题的分布;给定新的摘要文本时,利用训练得到的话题分布进行文本主题建模,在此基础上将结构化的文本话题与视频语义概念检测结果进行交叉验证,确定网络视频最终的文本语义主题和视频概念。
6.根据权利要求3所述的一种基于多源信息融合分析的网络视频热点事件发现方法,其特征在于:所述的视频语义结构化是指在完成视频概念检测和文本主题建模之后,将网络视频相关联的多源数据结构化为描述性关键字标签,实现网络视频语义结构化。
7.根据权利要求1所述的一种基于多源信息融合分析的网络视频热点事件发现方法,其特征在于:步骤4所述的客观热度参数和包括网络视频的点击率、扩散速度。
8.根据权利要求1所述的一种基于多源信息融合分析的网络视频热点事件发现方法,其特征在于:步骤5所述的网络视频敏感度预测模型,是通过用户定义的敏感词字典构造敏感度图谱,再基于该图谱对匹配的敏感词进行协同过滤打分,分数越高敏感度越高,反之越低。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610109051.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:信息推荐方法及装置
- 下一篇:一种基于SOLR的关键字词识别办法
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置