[发明专利]基于会话的视频分类方法在审
申请号: | 201811289307.2 | 申请日: | 2018-10-31 |
公开(公告)号: | CN109460470A | 公开(公告)日: | 2019-03-12 |
发明(设计)人: | 黄继风;但宇豪;林晓 | 申请(专利权)人: | 上海师范大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F17/27 |
代理公司: | 上海申新律师事务所 31272 | 代理人: | 竺路玲 |
地址: | 200232 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 文本 视频分类 会话 分类 特征词 权重 预处理 持续时间信息 特征提取步骤 分类效果 海量视频 会话内容 权重向量 视频样本 特征提取 文本分类 性能提升 引入 富含 算法 转换 赋予 改进 | ||
1.一种基于会话的视频分类方法,其特征在于,包含以下步骤:
A.将视频中的会话内容转换成文本;
B.对文本进行预处理;
C.对文本进行特征提取;
D.对文本进行表示;
E.对文本进行分类并根据文本分类结果对视频进行分类。
2.如权利要求1所述的基于会话的视频分类方法,其特征在于,所述步骤A还包含以下步骤:
A1为每个视频提取音频;
A2将音频转换为文本。
3.如权利要求1所述的基于会话的视频分类方法,其特征在于,所述步骤B还包含以下步骤:
B1对文本进行分词;
B2对文本去除停用词;
B3为所有视频统计会话部分持续的总时长;
B4根据分词结果为视频库生成词袋;
B5统计每个词对应的会话部分在视频中持续的时间。
4.如权利要求1所述的基于会话的视频分类方法,其特征在于,所述步骤C还包含以下步骤:
C1取词袋中的词作为所有文本的特征词;
C2为所有文本的每个特征词计算词频;
C3为每个特征词计算逆向文件概率;
C4使用改进的TF-IDF算法为视频库中的每个视频的所有特征词计算权重。
5.如权利要求1所述的基于会话的视频分类方法,其特征在于,
所述步骤D还包含以下步骤:
D1为视频库中的每个视频生成权重向量;
D2为视频样本的各类别产生基准权重向量;
所述步骤D中所采用的文本表示模型为词袋模型。
6.如权利要求1所述的基于会话的视频分类方法,其特征在于,
所述步骤E还包含以下步骤:
E1计算待分类视频的权重向量与各类别的基准权重向量之间的距离;
E2取Di中的最小值所对应的类别作为视频i所属的类别。
7.如权利要求1或4所述的基于会话的视频分类方法,其特征在于,所述步骤C4中所采用的特征词权重计算方法为改进的TF-IDF算法,其计算公式如下:
其中,是视频库中第i个视频的第j个特征词wij的词频,其定义如下:
其中,是词wij的逆向文件概率,其定义如下:
其中,tanh函数定义如下:
其中,Locijk代表第i个视频的第j个特征词在该文档中的第k次出现所具有的结构权重,由用户定义;
其中,tij是词袋中的第j个特征词在第i个视频中的会话持续时间;
其中,Ti是第i个视频的会话总时长。
8.如权利要求1或5所述的基于会话的视频分类方法,其特征在于,所述步骤D2为视频样本的各类别产生基准权重向量;
第c类视频的基准权重向量为
其中,是第c类视频的基准权重向量中第i个特征词的权重,其对应词语及顺序与词袋相同;
其中,在类别c的基准权重向量中,第j个特征词的权重定义如下:
其中,Wcij是c类下第i个视频样本的第j个特征词的权重,Tci是c类下第i个视频样本的会话总时长;
计算后,产生基准权重矩阵:
α={αc1,αc2,αc3,…,αcn}
其中,αcn是第n类的基准权重向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海师范大学,未经上海师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811289307.2/1.html,转载请声明来源钻瓜专利网。