[发明专利]基于会话的视频分类方法在审

申请号：	201811289307.2	申请日：	2018-10-31
公开（公告）号：	CN109460470A	公开（公告）日：	2019-03-12
发明（设计）人：	黄继风;但宇豪;林晓	申请（专利权）人：	上海师范大学
主分类号：	G06F16/35	分类号：	G06F16/35;G06F17/27
代理公司：	上海申新律师事务所 31272	代理人：	竺路玲
地址：	200232 ***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	视频文本视频分类会话分类特征词权重预处理持续时间信息特征提取步骤分类效果海量视频会话内容权重向量视频样本特征提取文本分类性能提升引入富含算法转换赋予改进
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明基于会话的视频分类方法，涉及视频分类技术领域。本发明包含以下步骤：A.将视频中的会话内容转换成文本；B.对文本进行预处理；C.对文本进行特征提取；D.对文本进行表示；E.对文本进行分类并根据文本分类结果对视频进行分类。本发明在特征提取步骤引入改进的TF‑IDF算法，通过加入结构权重Loc及项，为特征词权重赋予特征词在视频中的位置及持续时间信息，从而达到对富含会话的视频较理想的分类效果。同时，本发明还通过引入基准权重向量，使得在计算待分类视频与各类视频样本的距离时只需要计算一次，在对海量视频分类时性能提升显著。

技术领域

本发明涉及视频分类技术领域，具体指一种基于会话的视频分类方法。

背景技术

随着互联网的发展，网络上的视频数量呈几何倍数增长，如何有效地对这些网络视频进行分类成为一个非常重要的课题。视频分类是指在已有的已分类的视频样本基础上构建一个分类器，它按照预先定义的分类体系为每一个待分类视频确定一个或多个类别，使得用户可以更加方便地检索视频。视频自动分类就是用带有大量特征的视频对分类规则或模型参数进行训练，然后使用训练后的分类规则或模型对待分类视频进行分类。

国内外已有许多关于视频分类的研究，它们大多采用基于视觉的视频分类方法，其步骤包括首先对视频进行基于视觉的特征提取，然后进行行为表示，最后对视频进行分类。这种方法对场景特征鲜明、人物动作变化较大的视频有较好的分类效果。但对于场景单一、富含对话内容的视频(如访谈类节目)则无法有效分类。

发明内容

为了克服现有的基于视觉的视频分类方法无法有效对富合会话的视频进行分类的问题，提出一种基于会话的视频分类方法。

本发明一种基于会话的视频分类方法，包含以下步骤：

A.将视频中的会话内容转换成文本；

B.对文本进行预处理；

C.对文本进行特征提取；

D.对文本进行表示；

E.对文本进行分类并根据文本分类结果对视频进行分类。

所述步骤A包含以下步骤：

A1为每个视频提取音频；

A2将音频转换为文本；