[发明专利]一种基于多GRU层神经网络的推荐方法与系统有效
申请号: | 201710078094.8 | 申请日: | 2017-02-14 |
公开(公告)号: | CN106897404B | 公开(公告)日: | 2021-04-09 |
发明(设计)人: | 刘俊涛;李伦;黄志刚 | 申请(专利权)人: | 中国船舶重工集团公司第七0九研究所 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;H04L29/08;G06N3/08 |
代理公司: | 武汉河山金堂专利事务所(普通合伙) 42212 | 代理人: | 胡清堂 |
地址: | 430074 湖北省武汉市*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 gru 神经网络 推荐 方法 系统 | ||
1.一种基于多GRU层神经网络的推荐方法,其特征在于,包括用于表示用户偏好的多GRU层神经网络,所述多GRU层神经网络包括输入层、中间层和输出层;所述中间层由多个GRU层构成;所述方法包括以下步骤:
S1,收集用户对物品的历史行为,每条记录为一个四元组(u,i,a,t),其中u是用户编号,a是行为的类别,i是行为针对的物品的编号,t是行为发生的时间;
S2,按照行为发生时间对每一个用户记录的历史行为进行先后排序;并针对每一个用户生成相应的训练样本;
S3,根据训练样本对设计的多GRU层神经网络进行训练,确定多GRU层神经网络中的权重矩阵;
S4,根据训练后的多GRU层神经网络为每一个用户生成推荐列表;
所述多GRU层神经网络的结构为:
所述输入层的输入包括用户信息u(t)、t时刻用户行为信息a(t)以及t时刻用户行为的目标物品信息v(t),所述输出层的输出包括t时刻输出层的输出o(t);
构成中间层的每个所述GRU层均包括重置门r、更新门z、t时刻输出s(t)、t-1时刻输出s(t-1)以及替代隐藏层g;每个GRU层的t时刻输出si(t)(i=0,1,...,L)为该层的输出,其为一个h×1的向量,h为GRU层的维数;
构成中间层的第0个GRU层GRU0的重置门r0为一个h×1的向量,t时刻重置门r0的计算方法为:
其中,分别表示输入层u(t)、a(t)、v(t)、s0(t-1)连接到GRU0中的重置门r0的权重矩阵;σ是sigmoid函数,σ(x)=1/(1+e-x);
GRU0的更新门z0为一个h×1的向量,t时刻更新门z0的计算方法为:
其中,分别表示输入层u(t)、a(t)、v(t)、s0(t-1)连接到GRU0中的更新门z0的权重矩阵;
GRU0的替代隐藏层g0为一个h×1的向量,t时刻g0的计算方法为:
其中,分别表示输入层u(t)、a(t)、v(t)、s0(t-1)连接到GRU0中的替代隐藏层g0的权重矩阵;表示按对应元素相乘;
t时刻GRU0的输出s0(t)为一个h×1的向量,其计算方法为:
构成中间层的第l(l=1,2,...,L)个GRU层GRUl的重置门rl为一个h×1的向量,t时刻重置门rl的计算方法为:
其中,Wlr,Vlr,Ylr分别表示u(t)、a(t)、v(t)、sl(t-1)、sl-1(t)连接到GRUl中的重置门rl的权重矩阵;
GRUl的更新门zl为一个h×1的向量,t时刻更新门zl的计算方法为:
其中,Wlz,Vlz,Ylz分别表示u(t)、a(t)、v(t)、sl(t-1)、sl-1(t)连接到GRUl中的更新门zl的权重矩阵;
GRUl的替代隐藏层gl为一个h×1的向量,t时刻gl的计算方法为:
其中,Wlg,Vlg,Ylg分别表示u(t)、a(t)、v(t)、sl(t-1)、sl-1(t)连接到GRUl中的替代隐藏层gl的权重矩阵;
t时刻GRUl的输出sl(t)为一个h×1的向量,其计算方法为:
t时刻输出层的输出o(t)为一个h×1的向量,o(t)的第k个元素表示用户喜欢第k个物品的概率,o(t)计算方法为:
o(t)=softmax(YsL(t))
其中,Y是第L个GRU层GRUL连接到输出层的权重矩阵,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国船舶重工集团公司第七0九研究所,未经中国船舶重工集团公司第七0九研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710078094.8/1.html,转载请声明来源钻瓜专利网。