[发明专利]一种基于弹幕的视频语义标注方法、装置及电子设备有效
申请号: | 201711378169.0 | 申请日: | 2017-12-19 |
公开(公告)号: | CN108108353B | 公开(公告)日: | 2020-11-10 |
发明(设计)人: | 王瑞东;田野;马建;王文东;阙喜戎;龚向阳 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/284;G06F16/78;H04N21/4788;H04N21/488;H04N21/84;H04N21/845 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 马敬;项京 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例提供了一种基于弹幕的视频语义标注方法,包括:获得目标视频弹幕中的所有词语及对应的时间戳;将目标视频平均划分为预设数量个时间片;根据预设的词语与主题及情节的概率对应关系,生成包含每个时间片对应的主题的初始主题集合及包含每个时间片对应的情节的初始情节集合;生成字典词汇集合及词汇分布矩阵;计算所述字典词汇集合的时间先验信息;使用预设的弹幕词汇的全概率公式,计算每个字典词汇对应各个主题和情节的概率;生成所述时间片的情节‑主题分布矩阵;将相邻的相似时间片合并为一个时间片;确定各个时间片对应的情节;对目标视频进行标注。应用本发明实施例提供的方案进行视频语义标注,使得对视频语义的标注更加准确。 | ||
搜索关键词: | 一种 基于 弹幕 视频 语义 标注 方法 装置 电子设备 | ||
【主权项】:
1.一种基于弹幕的视频语义标注方法,其特征在于,所述方法包括:对目标视频的所有弹幕进行分词处理,获得弹幕中的所有词语;对弹幕中的所有词语进行去停用词处理,得到不重复的字典词汇,生成字典词汇集合,及由每个字典词汇在每个时间片的数量构成的词汇分布矩阵;根据各个弹幕在目标视频中的出现时间,获得每条词语对应的时间戳;根据所述目标视频的播放时长,将所述目标视频平均划分为预设数量个时间片,并记录所述每个时间片的开始时间和结束时间;针对每个时间片,将时间戳在该时间片的开始时间和结束时间内的所有词语组成一个文档,生成包含所有时间片对应的文档的文档集合;针对每个时间片,随机初始化,获得初始主题集合和初始情节集合;根据所述目标视频的总时长、词汇分布矩阵、每个时间片的结束时间和各个词语的时间戳,计算所述字典词汇集合中每个字典词汇相对于每个时间片的时间先验信息;针对所述初始主题集合和初始情节集合中的各个主题和情节,使用预设的弹幕词汇的全概率公式及所述时间先验信息,计算所述每个字典词汇对应各个主题和情节的概率;生成所述各个字典词语与各个主题及情节的概率对应关系;针对每个时间片,根据生成的各个字典词语与主题及情节的概率对应关系,确定该时间片对应的主题及情节,生成所述时间片的情节-主题-词语分布矩阵;根据所述每个时间片的情节-主题-词语分布矩阵,计算相邻时间片的相似度;根据所述相邻时间片的相似度,判断所述相邻时间片的情节-主题-词语分布是否相似;若为是,则将所述相邻时间片合并为一个时间片;根据所述各个时间片的情节-主题-词语分布,确定各个时间片对应的情节;根据所述各个时间片对应的情节,对所述目标视频进行标注。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711378169.0/,转载请声明来源钻瓜专利网。