[发明专利]一种基于弹幕的视频语义标注方法、装置及电子设备有效

专利信息
申请号: 201711378169.0 申请日: 2017-12-19
公开(公告)号: CN108108353B 公开(公告)日: 2020-11-10
发明(设计)人: 王瑞东;田野;马建;王文东;阙喜戎;龚向阳 申请(专利权)人: 北京邮电大学
主分类号: G06F40/289 分类号: G06F40/289;G06F40/284;G06F16/78;H04N21/4788;H04N21/488;H04N21/84;H04N21/845
代理公司: 北京柏杉松知识产权代理事务所(普通合伙) 11413 代理人: 马敬;项京
地址: 100876 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明实施例提供了一种基于弹幕的视频语义标注方法,包括:获得目标视频弹幕中的所有词语及对应的时间戳;将目标视频平均划分为预设数量个时间片;根据预设的词语与主题及情节的概率对应关系,生成包含每个时间片对应的主题的初始主题集合及包含每个时间片对应的情节的初始情节集合;生成字典词汇集合及词汇分布矩阵;计算所述字典词汇集合的时间先验信息;使用预设的弹幕词汇的全概率公式,计算每个字典词汇对应各个主题和情节的概率;生成所述时间片的情节‑主题分布矩阵;将相邻的相似时间片合并为一个时间片;确定各个时间片对应的情节;对目标视频进行标注。应用本发明实施例提供的方案进行视频语义标注,使得对视频语义的标注更加准确。
搜索关键词: 一种 基于 弹幕 视频 语义 标注 方法 装置 电子设备
【主权项】:
1.一种基于弹幕的视频语义标注方法,其特征在于,所述方法包括:对目标视频的所有弹幕进行分词处理,获得弹幕中的所有词语;对弹幕中的所有词语进行去停用词处理,得到不重复的字典词汇,生成字典词汇集合,及由每个字典词汇在每个时间片的数量构成的词汇分布矩阵;根据各个弹幕在目标视频中的出现时间,获得每条词语对应的时间戳;根据所述目标视频的播放时长,将所述目标视频平均划分为预设数量个时间片,并记录所述每个时间片的开始时间和结束时间;针对每个时间片,将时间戳在该时间片的开始时间和结束时间内的所有词语组成一个文档,生成包含所有时间片对应的文档的文档集合;针对每个时间片,随机初始化,获得初始主题集合和初始情节集合;根据所述目标视频的总时长、词汇分布矩阵、每个时间片的结束时间和各个词语的时间戳,计算所述字典词汇集合中每个字典词汇相对于每个时间片的时间先验信息;针对所述初始主题集合和初始情节集合中的各个主题和情节,使用预设的弹幕词汇的全概率公式及所述时间先验信息,计算所述每个字典词汇对应各个主题和情节的概率;生成所述各个字典词语与各个主题及情节的概率对应关系;针对每个时间片,根据生成的各个字典词语与主题及情节的概率对应关系,确定该时间片对应的主题及情节,生成所述时间片的情节-主题-词语分布矩阵;根据所述每个时间片的情节-主题-词语分布矩阵,计算相邻时间片的相似度;根据所述相邻时间片的相似度,判断所述相邻时间片的情节-主题-词语分布是否相似;若为是,则将所述相邻时间片合并为一个时间片;根据所述各个时间片的情节-主题-词语分布,确定各个时间片对应的情节;根据所述各个时间片对应的情节,对所述目标视频进行标注。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201711378169.0/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top