[发明专利]一种用于序列数据的多尺度深度学习识别方法在审

专利信息
申请号: 202210194015.0 申请日: 2022-03-01
公开(公告)号: CN114565082A 公开(公告)日: 2022-05-31
发明(设计)人: 高华;胡晨琛;毛科技;毛家发 申请(专利权)人: 浙江工业大学
主分类号: G06N3/04 分类号: G06N3/04;G06N3/08;G06V40/20;G06V20/40;G06V10/764;G06V10/774;G06V10/82;G10L25/30;G10L25/63;G06K9/62
代理公司: 杭州求是专利事务所有限公司 33200 代理人: 忻明年
地址: 310014 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 用于 序列 数据 尺度 深度 学习 识别 方法
【权利要求书】:

1.一种用于序列数据的多尺度深度学习识别方法,其特征在于,所述用于序列数据的多尺度深度学习识别方法,包括:

采集序列数据并标注,构成原始序列训练数据集;

从原始序列训练数据集的训练样本中随机截取连续时长为t的数据进行采样,前向传播输入到修改好的深度神经网络模型,经所述深度神经网络模型提取第一特征,将所述第一特征输入到识别器,计算识别器输出与真实标签的第一交叉熵损失;

对时长为t的数据进行随机扩充或缩减,并随机重采样,重采样取得的数据前向传播输入到修改好的深度神经网络模型,经所述深度神经网络模型提取第二特征,将所述第二特征输入到识别器,计算识别器输出与真实标签的第二交叉熵损失;

计算所述第一特征和第二特征的特征差异,并计算所述第一交叉熵损失、第二交叉熵损失和特征差异的加权和损失,根据加权和损失进行反向传播,更新所述深度神经网络模型的网络参数;

在所述深度神经网络模型训练完成后,采用训练好的深度神经网络模型用于序列数据识别。

2.根据权利要求1所述的用于序列数据的多尺度深度学习识别方法,其特征在于,所述序列数据为不同人的语音数据,所述标注包括生气、高兴、害怕、悲伤、惊讶和中性共六种情绪的一种。

3.根据权利要求1所述的用于序列数据的多尺度深度学习识别方法,其特征在于,所述序列数据为不同人不同动作的视频数据,所述标注包括微笑、大笑、咀嚼、交谈、吸烟、吃、喝、侧手翻、拍手、爬、跳、摔倒、翻转、倒立、跳、拉、推、跑、坐、翻跟头、站起来、转身、梳头、抓、打球、骑自行车、拥抱、握手共二十八种行为的一种。

4.根据权利要求1所述的用于序列数据的多尺度深度学习识别方法,其特征在于,所述随机重采样,包括:

对每条训练样本数据,取随机数r,得到长度为原长度r倍的训练样本数据。

5.根据权利要求1所述的用于序列数据的多尺度深度学习识别方法,其特征在于,所述计算所述第一特征和第二特征的特征差异,采用公式如下:

其中,Ldiff表示第一特征F1和第二特征F2的特征差异,||·||2是二范数。

6.根据权利要求1所述的用于序列数据的多尺度深度学习识别方法,其特征在于,所述深度神经网络模型采用一维卷积替换所述VGG16网络中的二维卷积,采用自适应池化操作替换所述VGG16网络中最后一个最大池化操作,采用所述VGG16网络最后的softmax层作为识别器。

7.根据权利要求1所述的用于序列数据的多尺度深度学习识别方法,其特征在于,所述深度神经网络模型采用3D Resnet,采用自适应池化操作替换所述3D Resnet第5个res模块后面的最大池化操作,采用所述3D Resnet的最后一层softmax层作为识别器。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210194015.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top