[发明专利]一种基于RNN的多任务学习方法在审
申请号: | 201810112482.8 | 申请日: | 2018-02-05 |
公开(公告)号: | CN108197701A | 公开(公告)日: | 2018-06-22 |
发明(设计)人: | 王磊;翟荣安;王纯配;顾仓;王毓;刘晶晶;王飞;于振中;李文兴 | 申请(专利权)人: | 哈工大机器人(合肥)国际创新研究院 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 北京华际知识产权代理有限公司 11676 | 代理人: | 陈晓蕾 |
地址: | 230601 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: |
本发明提供了一种基于RNN的多任务学习方法,所述方法包括以下步骤:步骤S1:初始化系统参数θ=(W,U,B,V);步骤S2:输入样例x1,i,…,xR,i,学习公有信息Xco,将公有信息补偿到单个任务的训练中;步骤S3:计算每个神经网络的预测标签向量输出 |
||
搜索关键词: | 公有信息 任务学习 神经网络 学习 初始化系统 标签向量 迭代更新 模型参数 输出计算 输出优化 特征输入 信息共享 下降法 有效地 求解 算法 引用 返回 预测 更新 | ||
【主权项】:
1.一种基于RNN的多任务学习方法,其特征在于,所述方法包括以下步骤:步骤S1:初始化系统参数θ=(W,U,B,V),其中,W表示神经网络层与层之间连接的权值矩阵;U表示数据在输入神经网络时的权值矩阵;B表示神经网络层与层之间的偏置矩阵;V表示神经网络隐藏层到softmax层的权值矩阵;步骤S2:输入样例x1,i,…,xR,i,学习公有信息Xco,将公有信息补偿到单个任务的训练中;步骤S3:计算每个神经网络的预测标签向量输出
计算任务r的损失Lr,i;步骤S4:根据梯度下降法和BPTT算法求解θ=(W,U,B,V)的梯度,确定任务r关于公有信息Xco的梯度;步骤S5:确定学习率η,更新各权值梯度W=W‑η·δW,其中,δW表示在神经网络反向传播时,通过梯度下降法得到的权值矩阵的偏导数;步骤S6:判断神经网络是否达到稳定,如果是执行步骤S7;如果否,返回步骤S2,迭代更新模型参数;步骤S7:输出优化模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈工大机器人(合肥)国际创新研究院,未经哈工大机器人(合肥)国际创新研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810112482.8/,转载请声明来源钻瓜专利网。