[发明专利]一种基于深度神经网络的动态纹理识别方法在审
申请号: | 201510268336.0 | 申请日: | 2015-05-25 |
公开(公告)号: | CN104966093A | 公开(公告)日: | 2015-10-07 |
发明(设计)人: | 王勇;罗新斌 | 申请(专利权)人: | 苏州珂锐铁电气科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 苏州市中南伟业知识产权代理事务所(普通合伙) 32257 | 代理人: | 杨明 |
地址: | 215000 江苏省苏州*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于深度神经网络的动态纹理识别方法,该方法从每个像素时间序列里面抽取混沌特征;用k均值量化得到最初的代码本,并用PMI方法来表示这些代码本之间的关系;通过深度神经学习来有效的建立中层特征之间的语义联系;利用k均值聚类算法来得到高层特征,该基于深度神经网络的动态纹理识别方法,能够有效识别外表或者形状相似的视频词特征,防止忽略同时出现的统计特性与视频的联系。 | ||
搜索关键词: | 一种 基于 深度 神经网络 动态 纹理 识别 方法 | ||
【主权项】:
一种基于深度神经网络的动态纹理识别方法,其特征在于:包括以下步骤:步骤1:对训练视频中的每个像素时间序列计算混沌特征及相关特征,并将所有特征组成混沌特征向量,所述视频的每个像素点位置由所述特征向量来表示,所有特征向量组成所述训练视频的特征向量矩阵;步骤2:用k均值来产生最初的代码本:将所有训练的特征向量矩阵中的特征向量,用欧式距离来得到k个聚类中心,形成代码本;步骤3:给定若干个训练视频,产生一个视频代码词频率矩阵H,其中每行向量h代表一个视频,每列代表一个代码词,通过所述代码词之间的相似性估计出每列向量之间的距离以及每列向量表示代码词在视频中的分布,然后将每个代码词频率通过逐点互信息转换,通过视频和代码词之间的逐点互信息表示代码词和训练数据的分布;步骤4:通过深度神经网络进行动态纹理识别,具体包括以下步骤;步骤4.1:深度神经网络首先通过多层的模型训练得到一组具有表示性能的特征,然后通过后向传播来对参数进行调整,得到预测类别的模型;步骤4.2:在训练阶段,通过训练原始特征得到一种语义特征,所有的训练和测试视频通过语义特征直方图来表示,动态纹理识别模型通过支持向量机(Support Vector Machine(SVM))来学习得到,输入为语义特征的直方图,在测试阶段,给出一个位置的视频表示为一个词袋模型,然后通过训练的SVM来识别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州珂锐铁电气科技有限公司,未经苏州珂锐铁电气科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510268336.0/,转载请声明来源钻瓜专利网。