[发明专利]一种基于弹幕的视频语义标注方法、装置及电子设备有效
申请号: | 201711378169.0 | 申请日: | 2017-12-19 |
公开(公告)号: | CN108108353B | 公开(公告)日: | 2020-11-10 |
发明(设计)人: | 王瑞东;田野;马建;王文东;阙喜戎;龚向阳 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/284;G06F16/78;H04N21/4788;H04N21/488;H04N21/84;H04N21/845 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 马敬;项京 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 弹幕 视频 语义 标注 方法 装置 电子设备 | ||
1.一种基于弹幕的视频语义标注方法,其特征在于,所述方法包括:
对目标视频的所有弹幕进行分词处理,获得弹幕中的所有词语;
对弹幕中的所有词语进行去停用词处理,得到不重复的字典词汇,生成字典词汇集合,及由每个字典词汇在每个时间片的数量构成的词汇分布矩阵;
根据各个弹幕在目标视频中的出现时间,获得每条词语对应的时间戳;
根据所述目标视频的播放时长,将所述目标视频平均划分为预设数量个时间片,并记录所述每个时间片的开始时间和结束时间;
针对每个时间片,将时间戳在该时间片的开始时间和结束时间内的所有词语组成一个文档,生成包含所有时间片对应的文档的集合;
针对每个时间片,随机初始化,获得初始主题集合和初始情节集合;根据所述目标视频的总时长、词汇分布矩阵、每个时间片的结束时间和各个词语的时间戳,计算所述字典词汇集合中每个字典词汇相对于每个时间片的时间先验信息;
针对所述初始主题集合和初始情节集合中的各个主题和情节,使用预设的弹幕词汇的全概率公式及所述时间先验信息,计算每个字典词汇对应各个主题和情节的概率;生成各个字典词汇与各个主题及情节的概率对应关系;
针对每个时间片,根据生成的各个字典词汇与主题及情节的概率对应关系,确定该时间片对应的主题及情节,生成所述时间片的情节-主题-词语分布矩阵;
根据所述每个时间片的情节-主题-词语分布矩阵,计算相邻时间片的相似度;
根据所述相邻时间片的相似度,判断所述相邻时间片的情节-主题-词语分布是否相似;
若为是,则将所述相邻时间片合并为一个时间片;
根据所述各个时间片的情节-主题-词语分布,确定各个时间片对应的情节;
根据所述各个时间片对应的情节,对所述目标视频进行标注;
其中,所述根据所述目标视频的总时长、词汇分布矩阵、每个时间片的结束时间和各个词语的时间戳,计算所述字典词汇集合中每个字典词汇相对于每个时间片的时间先验信息,包括:
通过以下表达式进行计算:
λ=|t1,t2,…,tW|T
其中,表示字典词汇wi相对于时间片j的时间先验信息,n表示所弹幕中的所有词语的数量,表示字典词汇wi中的第n个词语所对应的时间戳,epj表示时间片j的结束时间,VDE表示目标视频的总时长;ti表示字典词汇wi的时间先验信息;λ表示所述字典词汇集合的时间先验信息,E表示情节集合,|E|表示情节数量;
其中,在对弹幕中的所有词语进行去停用词处理,得到不重复的字典词汇,生成字典词汇集合之后,所述方法还包括:
针对每个时间片,根据所述字典词汇集合、预设的关键词提取算法及预设的原始权重,得到各个字典词汇对于每个时间片的重要性先验信息;
所述针对所述初始主题集合和初始情节集合中的各个主题和情节,使用预设的弹幕词汇的全概率公式及所述时间先验信息,计算每个字典词汇对应各个主题和情节的概率;生成各个字典词汇与各个主题及情节的概率对应关系,包括:
针对所述初始主题集合和初始情节集合中的各个主题和情节,使用预设的弹幕词汇的全概率公式、所述时间先验信息及所述重要性先验信息,计算所述每个字典词汇对应各个主题和情节的概率;生成所述各个字典词汇与各个主题及情节的概率对应关系;
其中,所述使用预设的弹幕词汇的全概率公式、所述时间先验信息及所述重要性先验信息,计算所述每个字典词汇对应各个主题和情节的概率,包括:
从所述初始主题集合中随机选择一个目标主题,从所述初始情节集合中随机选择一个目标情节,从所述字典词汇集合中随机选择一个字典词汇,作为目标词汇;
利用预设的全概率公式计算所述目标词汇同时属于所述目标主题和所述目标情节的概率;其中,所述全概率公式中包含所述时间先验信息及所述重要性先验信息;
重复选择目标主题、目标情节和目标词汇,计算所述目标词汇对应各个主题和情节的概率,直至达到预设的选择次数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711378169.0/1.html,转载请声明来源钻瓜专利网。