[发明专利]基于会话的视频分类方法在审
申请号: | 201811289307.2 | 申请日: | 2018-10-31 |
公开(公告)号: | CN109460470A | 公开(公告)日: | 2019-03-12 |
发明(设计)人: | 黄继风;但宇豪;林晓 | 申请(专利权)人: | 上海师范大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F17/27 |
代理公司: | 上海申新律师事务所 31272 | 代理人: | 竺路玲 |
地址: | 200232 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 文本 视频分类 会话 分类 特征词 权重 预处理 持续时间信息 特征提取步骤 分类效果 海量视频 会话内容 权重向量 视频样本 特征提取 文本分类 性能提升 引入 富含 算法 转换 赋予 改进 | ||
本发明基于会话的视频分类方法,涉及视频分类技术领域。本发明包含以下步骤:A.将视频中的会话内容转换成文本;B.对文本进行预处理;C.对文本进行特征提取;D.对文本进行表示;E.对文本进行分类并根据文本分类结果对视频进行分类。本发明在特征提取步骤引入改进的TF‑IDF算法,通过加入结构权重Loc及项,为特征词权重赋予特征词在视频中的位置及持续时间信息,从而达到对富含会话的视频较理想的分类效果。同时,本发明还通过引入基准权重向量,使得在计算待分类视频与各类视频样本的距离时只需要计算一次,在对海量视频分类时性能提升显著。
技术领域
本发明涉及视频分类技术领域,具体指一种基于会话的视频分类方法。
背景技术
随着互联网的发展,网络上的视频数量呈几何倍数增长,如何有效地对这些网络视频进行分类成为一个非常重要的课题。视频分类是指在已有的已分类的视频样本基础上构建一个分类器,它按照预先定义的分类体系为每一个待分类视频确定一个或多个类别,使得用户可以更加方便地检索视频。视频自动分类就是用带有大量特征的视频对分类规则或模型参数进行训练,然后使用训练后的分类规则或模型对待分类视频进行分类。
国内外已有许多关于视频分类的研究,它们大多采用基于视觉的视频分类方法,其步骤包括首先对视频进行基于视觉的特征提取,然后进行行为表示,最后对视频进行分类。这种方法对场景特征鲜明、人物动作变化较大的视频有较好的分类效果。但对于场景单一、富含对话内容的视频(如访谈类节目)则无法有效分类。
发明内容
为了克服现有的基于视觉的视频分类方法无法有效对富合会话的视频进行分类的问题,提出一种基于会话的视频分类方法。
本发明一种基于会话的视频分类方法,包含以下步骤:
A.将视频中的会话内容转换成文本;
B.对文本进行预处理;
C.对文本进行特征提取;
D.对文本进行表示;
E.对文本进行分类并根据文本分类结果对视频进行分类。
所述步骤A包含以下步骤:
A1为每个视频提取音频;
A2将音频转换为文本;
所述步骤B包含以下步骤:
B1对文本进行分词;
B2对文本去除停用词;
B3为所有视频统计会话部分持续的总时长;
B4根据分词结果为视频库生成词袋;
B5统计每个词对应的会话部分在视频中持续的时间;
所述步骤C包含以下步骤:
C1取词袋中的词作为所有文本的特征词;
C2为所有文本的每个特征词计算词频;
C3为每个特征词计算逆向文件概率;
C4使用改进的TF-IDF算法为视频库中的每个视频的所有特征词计算权重。
所述步骤D包含以下步骤:
D1为视频库中的每个视频生成权重向量;
D2为视频样本的各类别产生基准权重向量;
所述步骤D中所采用的文本表示模型为词袋模型。
所述步骤E包含以下步骤:
E1计算待分类视频的权重向量与各类别的基准权重向量之间的距离;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海师范大学,未经上海师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811289307.2/2.html,转载请声明来源钻瓜专利网。