[发明专利]基于深度残差长短时记忆网络的视频事件识别方法在审
申请号: | 201810235672.9 | 申请日: | 2018-03-21 |
公开(公告)号: | CN108764009A | 公开(公告)日: | 2018-11-06 |
发明(设计)人: | 龚声蓉;李永刚;刘纯平;季怡;曹李军;王朝晖 | 申请(专利权)人: | 苏州大学;苏州科达科技股份有限公司;常熟理工学院 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 苏州科仁专利代理事务所(特殊普通合伙) 32301 | 代理人: | 周斌;陆彩霞 |
地址: | 215000*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于深度残差长短时记忆网络的视频事件识别方法,包括:1)时空特征数据联接层设计,时空特征数据经长短时记忆单元(LSTM)同步解析后形成时空特征数据联接单元DLSTM(double‑LSTM),突出时空信息的一致性;2)DU‑DLSTM(dual unidirectional DLSTM)双单向结构设计,拓宽了网络的宽度,增加了特征选择范围;3)RDU‑DLSTM(residual dual unidirectional DLSTM)残差模块设计,解决更深层次的网络梯度消失问题;4)2C‑softmax目标函数设计,扩大类间距离的同时兼顾缩小类内距离。本方法优点是通过构建深度残差网络架构,解决梯度消失问题,同时利用时间网络、空间网络特征的一致性融合提高视频事件识别准确率。 | ||
搜索关键词: | 残差 视频事件识别 时空特征 记忆网络 数据联接单元 一致性融合 记忆单元 空间网络 类间距离 类内距离 模块设计 目标函数 时间网络 时空信息 数据联接 特征选择 网络架构 网络梯度 双单向 准确率 构建 解析 网络 | ||
【主权项】:
1.一种基于深度残差长短时记忆网络的视频事件识别方法,其特征在于,包括:1)时空特征数据联接单元设计时空特征数据经LSTM同步解析后形成时空特征数据联接单元DLSTM;2)DU‑DLSTM双单向结构设计每个DLSTM单元包含了来自时间CNN网络(Convolutional Neural Network)和空间CNN网络的输入,两个单向传递的DLSTM联接后构成DU‑DLSTM单元;3)RDU‑DLSTM残差模块设计多个DU‑DLSTM层再加一个恒等映射形成残差模块;4)2C‑softmax目标函数设计双中心Loss分别维护空间特征中心和时间特征中心,空间特征中心和时间特征中心按一定权重系数融合形成质心,给softmax的Loss加入双中心Loss以及DLSTM单元的正则项,构成2C‑softmax目标函数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学;苏州科达科技股份有限公司;常熟理工学院,未经苏州大学;苏州科达科技股份有限公司;常熟理工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810235672.9/,转载请声明来源钻瓜专利网。