[发明专利]一种可解释的基于域间显式交互的神经因子的推荐系统及方法有效
申请号: | 201911396812.1 | 申请日: | 2019-12-30 |
公开(公告)号: | CN111177557B | 公开(公告)日: | 2023-09-29 |
发明(设计)人: | 姚建国;白华伟;管海兵 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06N3/0464;G06N3/082 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 胡晶 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 可解释 基于 域间显式 交互 神经 因子 推荐 系统 方法 | ||
1.一种可解释的基于域间显式交互的神经因子的推荐系统,其特征在于,包括:
模块M1:电影评分数据集经过嵌入层得到域嵌入向量,域嵌入向量经过线性变化得到基向量,对域嵌入向量和基向量进行划分得到预设数量的子嵌入向量和子基向量;
模块M2:对每个子嵌入向量和子基向量进行显式交互得到子域的中间交互张量,利用不共享的一维卷积变量分别对子域的中间交互张量进行特征提取,得到新的子域表征向量;新的子域表征向量经过正则层和注意力层得到加权的子域嵌入向量;
模块M3:每个加权的子域嵌入向量在输出层进行特征融合,最后经过归一化函数得到用户对待预测电影感兴趣的概率;
所述电影评分数据集中每条数据记录包括:用户id,用户年龄,用户性别,用户职业,待预测的电影id,该电影的类型,三部该用户喜欢的电影id,三部该用户不喜欢的电影id,最后一次用户的评分时间;
所述模块M2包括:
模块M2.1:子基向量的列数通过相邻列进行拼接缩减至子域的行数,使得能够分别在不同的映射空间中进行显式交互;
模块M2.2:每个子域嵌入向量分别和对应的子基向量进行显式交互,子域嵌入向量的行和子基向量对应的列求二维向量哈达玛积,将哈达玛积伸展为一维向量,得到子域的中间交互张量;
模块M2.3:为每个子域嵌入向量初始化预设数量个一维卷积变量,一维卷积变量之间不共享参数,一维卷积变量的数量等于子域的数量,并且一维卷积变量与子域一一对应;
模块M2.4:每个子域的中间交互张量经由对应的一维卷积变量进行特征提取,得到新的子域表征向量,新的子域表征向量的行数保持不变;
模块M2.5:得到新的子域表征向量后,如果神经网络的下一层不是输出层,则把当前层的新的子域表征向量一半的列维度直接传递到输出层,并且对完整的当前层的每个新的子域表征向量进行Dropout正则化操作;
模块M2.6:把经过Dropout正则化操作后的子域表征向量传递到注意力层,采用自注意力机制,每个子域分别从整体计算得到注意力矩阵;利用得到的注意力矩阵对当前的子域表征向量进行加权求和,得到加权的子域表征向量;将加权的子域表征向量输入到神经网络的下一层;如果神经网络下一层是堆叠成,则对加权的子域表征向量重复模块M2.1至模块M2.6,直至得到的子域表征向量输入到神经网络下一层是输出层;
所述子基向量的列包含所有域的信息;
所述子域嵌入向量的行代表一个域的表征信息;
所述哈达玛积为一个二维向量,包含当前域和除当前域之外域的交互信息;
所述子域包括数据集中对应的子特征类别;
所述模块M2.6包括:
模块M2.6.1:注意力层接受两个输入,两个输入分别为当前层的子域表征向量和初始时的域嵌入向量,对注意力层的两个输入进行线性变换;
模块M2.6.2:经过线性变换后的两个输入利用余弦相似度求得一个余弦相似度矩阵,归一化余弦相似度矩阵得到注意力矩阵;
模块M2.6.3:利用注意力矩阵对输入的子域表征向量进行加权求和,得到加权的子域表征向量;
模块M2.6.4:加权的子域表征向量再和输入的子域表征向量进行加权求和得到最终的加权子域表征向量。
2.根据权利要求1所述的一种可解释的基于域间显式交互的神经因子的推荐系统,其特征在于,所述模块M1包括:
模块M1.1:初始化特征嵌入向量,通过输入层输入电影评分数据集经过嵌入层检索到对应的特征嵌入向量,通过包括线性相加和/或非线性相乘合并同一域的特征得到域嵌入向量;
模块M1.2:利用线性变换对域嵌入向量的特征维度进行伸缩变换得到基向量,变换后的基向量的特征维度等于域的数量或者倍数;域嵌入向量和基向量的行数对应域的数量,列数对应域的隐表征维度;
模块M1.3:把基向量按列特征维度划分预设数量子基向量;
模块M1.4:把域嵌入向量划分为预设数量的子域嵌入向量,子基向量的数量等于子域嵌入向量的数量,并且子基向量和子域嵌入向量一一对应;子域嵌入向量的行数等于对应子基向量的列数;
所述域包括为电影评分数据集的特征类别;
所述基向量的特征维度与电影评分数据集的域数量相关,为了便于显式交互,基向量的特征维度等于域数量的倍数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911396812.1/1.html,转载请声明来源钻瓜专利网。