[发明专利]基于特征重要性和双线性特征交互的移动应用推荐方法在审
申请号: | 202110853887.9 | 申请日: | 2021-07-28 |
公开(公告)号: | CN113554491A | 公开(公告)日: | 2021-10-26 |
发明(设计)人: | 曹步清;彭咪;陈俊杰 | 申请(专利权)人: | 湖南科技大学 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06N3/04;G06K9/62;G06F16/9535 |
代理公司: | 北京盛凡智荣知识产权代理有限公司 11616 | 代理人: | 叶似锦 |
地址: | 411201 湖南省湘潭市雨*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 特征 重要性 双线 交互 移动 应用 推荐 方法 | ||
1.基于特征重要性和双线性特征交互的移动应用推荐方法,其特征在于,包括如下步骤:
1)嵌入层:稀疏输入层对原始输入特征采用稀疏表示,嵌入层能够将稀疏特征嵌入到低维、连续的实值向量中,通过线性变换将稀疏矩阵变成密集矩阵进行矩阵的稠密化、提取矩阵的隐含特征,同时提升模型的泛化能力;嵌入层的输出表示如下:
E=[e1,e2,..,ei,...,ef] (1)
其中f代表域的数量,ei∈Rk则表示第i个域的表征,向量的大小k;
2)SENET层:不同的特征对目标任务应有不同的重要性,对于特定的CTR预测任务,通过SENET机制动态增大重要特征的权重,减少信息不足特征的权重;SENET通过三步组成:特征压缩、激励和重赋权值;首先对上一步得到的嵌入特征进行Squeeze操作,得到全局特征,然后对全局特征进行Excitation操作,学习各个特征间的关系,得到不同特征的权重,最后乘以原来的嵌入特征得到最终特征;
3)双线性交互层:结合内积和哈达玛积来学习具有额外参数的特征交互;交互向量pij可通过以下三种方式进行计算:
所有域
pij=vi·W⊙vj (5)
W∈Rk×k所有的向量(vi,vj)共用一个W;在双线性交互层中额外的参数量为k×k;
单个域
pij=vi·Wi⊙vj (6)
W∈Rk×k对应第i个域的参数矩阵,因此该层共需要维护f×k×k个参数;
域之间交互
pij=vi·Wij⊙vj (7)
W∈Rk×k对应第i个域与第j个域之间的权重矩阵,另外需要额外大小为的参数量;
双线性交互层从原始嵌入E输出交互向量p=[p1,...,pi,...,pn],以及从类SENET嵌入v输出交互向量q=[q1,...,qi,...,qn];其中向量pi∈Rk,qi∈Rk;
4)连接层:连接层将交互向量p和q连接起来,并将连接后的向量灌入到神经网络层;具体的过程可表示为如下形式:
C=[p1,...,pn,q1,...,qn]=[c1,...,c2n] (8)
5)深度网络:将深度神经网络DNN组件与浅层模型相结合,形成一个深度模型;输入是连接层的输出向量C,深度网络由多个全连接层组成,能够隐含地捕获高阶特征;令a(0)=[c1,...,c2n]表示初始输入,将a(0)灌入深度神经网络,其前馈过程如下:
a(l)=σ(Wla(l-1)+bl) (9)
a(l)为深度网络的第l层的输出,σ是sigmoid的函数,Wl表示模型的权重矩阵,bl表示模型的偏移量;
经过L层后,生成一个稠密的实值特征向量,输入到sigmoid函数中进行CTR预测:
yd=σ(WLa(L+1)+bL+1) (10)
其中L为深度模型的层数;
6)预测层:模型预测层的输出表达式如下:
其中作为模型的预测值,σ是sigmoid函数;m作为特征大小;wi是线性部分的第i个权重;
整个训练过程旨在最小化下面的目标函数:
其中yi是第i个样本的真实标签,对应第i个样本的预测标签;N为移动应用的样本总数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南科技大学,未经湖南科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110853887.9/1.html,转载请声明来源钻瓜专利网。