[发明专利]一种基于RNN的多任务学习方法在审

申请号：	201810112482.8	申请日：	2018-02-05
公开（公告）号：	CN108197701A	公开（公告）日：	2018-06-22
发明（设计）人：	王磊;翟荣安;王纯配;顾仓;王毓;刘晶晶;王飞;于振中;李文兴	申请（专利权）人：	哈工大机器人（合肥）国际创新研究院
主分类号：	G06N3/04	分类号：	G06N3/04;G06N3/08
代理公司：	北京华际知识产权代理有限公司 11676	代理人：	陈晓蕾
地址：	230601 安徽省***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提供了一种基于RNN的多任务学习方法，所述方法包括以下步骤：步骤S1：初始化系统参数θ＝(W,U,B,V)；步骤S2：输入样例x1,i,…,xR,i，学习公有信息Xco,将公有信息补偿到单个任务的训练中；步骤S3：计算每个神经网络的预测标签向量输出计算任务r的损失Lr,i；步骤S4：根据梯度下降法和BPTT算法求解θ＝(W,U,B,V)的梯度，确定任务r关于公有信息Xco的梯度；步骤S5：确定学习率η，更新各权值梯度W＝W‑η·δW；步骤S6：判断神经网络是否达到稳定，如果是执行步骤S7；如果否，返回步骤S2，迭代更新模型参数；步骤S7：输出优化模型。本发明能有效利用RNN学习多任务之间的公有特征，并把公有特征输入到单个任务的学习中，实现信息共享。并通过在RNN中引用GRU结构，能有效地解决梯度消失问题。
搜索关键词：	公有信息任务学习神经网络学习初始化系统标签向量迭代更新模型参数输出计算输出优化特征输入信息共享下降法有效地求解算法引用返回预测更新
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于RNN的多任务学习方法，其特征在于，所述方法包括以下步骤：步骤S1：初始化系统参数θ＝(W,U,B,V)，其中，W表示神经网络层与层之间连接的权值矩阵；U表示数据在输入神经网络时的权值矩阵；B表示神经网络层与层之间的偏置矩阵；V表示神经网络隐藏层到softmax层的权值矩阵；步骤S2：输入样例x1,i,…,xR,i，学习公有信息Xco,将公有信息补偿到单个任务的训练中；步骤S3：计算每个神经网络的预测标签向量输出计算任务r的损失L_r,i；步骤S4：根据梯度下降法和BPTT算法求解θ＝(W,U,B,V)的梯度，确定任务r关于公有信息Xco的梯度；步骤S5：确定学习率η，更新各权值梯度W＝W‑η·δW，其中，δW表示在神经网络反向传播时，通过梯度下降法得到的权值矩阵的偏导数；步骤S6：判断神经网络是否达到稳定，如果是执行步骤S7；如果否，返回步骤S2，迭代更新模型参数；步骤S7：输出优化模型。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于哈工大机器人（合肥）国际创新研究院，未经哈工大机器人（合肥）国际创新研究院许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201810112482.8/，转载请声明来源钻瓜专利网。

上一篇：一种生成式对抗网络建模方法及装置
下一篇：一种基于评价网络与循环神经网络的产品设计的方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06N 基于特定计算模型的计算机系统
G06N3-00 基于生物学模型的计算机系统
G06N3-02 .采用神经网络模型
G06N3-12 .采用遗传模型
G06N3-04 ..体系结构，例如，互连拓扑
G06N3-06 ..物理实现，即神经网络、神经元或神经元部分的硬件实现
G06N3-08 ..学习方法

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于RNN的多任务学习方法在审

专利文献下载