[发明专利]一种基于动态注意力图网络的营销套利黑产的识别方法在审
申请号: | 202111040219.0 | 申请日: | 2021-09-06 |
公开(公告)号: | CN113919862A | 公开(公告)日: | 2022-01-11 |
发明(设计)人: | 傅剑文;陈心童;章建森;韩弘炀;周文彬 | 申请(专利权)人: | 天翼电子商务有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06N3/04;G06N3/08;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 102200 北京市昌平*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 动态 注意 力图 网络 营销 套利 识别 方法 | ||
1.一种基于动态注意力图网络的营销套利黑产的识别方法,其特征在于,包括以下步骤:
一、定义一种动态图网络结构,它由两类节点,四种关系边,和T个时刻组成:
1)两类节点:图网络中含有用户节点Vc,和商户节点Vb两类节点
2)四种关系边分别是:
A)用户与用户的设备关系边Ed:
根据访问日志中过去某段时间内,不同用户访问设备IP存在相同性,生成用户节点和用户节点之间的设备关系边;
B)用户与用户的支付关系边Ep:
根据业务系统中过去某段时间内,用户和用户之间存在转账支付行为,生成用户节点和用户节点之间的支付关系边;
C)用户与用户的社交关系边Es:
根据业务系统中过去某段时间内,用户和用户之间存在一方分享营销活动信息并成功邀请另一方参加该营销活动的行为,生成用户节点和用户节点之间的社交关系边;
D)用户与商户的交易关系边Et:
根据业务系统中过去某段时间内,用户在商户里发生了交易支付的行为,生成用户节点和商户节点之间的交易关系边;
3)T个时刻是指:
在时间轴上以t0时刻为初始,ω为间隔,选取连贯的T个时刻点;在每个时刻点上都生成一张由上述2类节点和4种关系边的关系图网络;这样即反映出了图网络随着时间的T个时刻的演变;
二、在图数据库中为T个时刻生成T张网络图,分别为
把每个时刻点的用户集Vc分别从图数据库模块中导入至分布式数据库模块,并为每个时刻点的每个用户生成代表其属性的m维特征向量,特征向量的特征域可以选取常见的自然人属性特征予以构建,也可以引入基于专家经验提炼的统计类特征,例如:过去某段时间访问某活动的次数等等,以获取更好的识别效果;这样就为每个时刻点的用户集Vc生成了属性特征矩阵以表的形式存入分布式数据库模块中;下标中n0,n1,...分别表示每个时刻点用户集的数量;
同理,把每个时刻点的商户集Vb分别从图数据库模块中导入至分布式数据库模块,并为每个时刻点的每个商户生成代表其属性的k维特征向量;这样就为每个时刻点的商户集Vb生成了属性特征矩阵以表的形式存入分布式数据库模块中;下标中l0,l1,...分别表示每个时刻点商户集的数量;
三、基于历史的套利用户正负样本,分别为每个时刻点的用户集Vc打上标签,并以表的形式存入分布式数据库模块中;打完标签后,用户集Vc变成有标签(Vlabeled)和无标签(Vunlabeled)两种样本,Vlabeled样本被分为已知套利用户样本Vlabeled=1和已知非套利用户样本Vlabeled=0,图网络上所有的商户节点都设置为无标签样本;
四、设计一种新型图注意力机制,其特点是1)分别为用户节点和商户节点都定义了独立的映射矩阵,通过映射矩阵把这两类不同维度特征向量映射成同一维度,实现了用户节点和商户点在信息聚合时的统一;2)基于图上定义的四种关系边,定义了一种多边注意力的机制,即为每个关系边都引入了一套独立的注意力的学习参数,从而实现了多种关系边在信息聚合时的统一;
具体操作如下:
1)首先根据四种关系边定义4套独立的注意力学习参数并初始化学习参数:
A)用户与用户设备关系Ed:定义共享线性映射矩阵和注意力共享向量ad∈R2f;
B)用户与用户支付关系Ep:定义共享线性映射矩阵和注意力共享向量ap∈R2f;
C)用户与用户的社交关系边Es:定义共享线性映射矩阵和注意力共享向量as∈R2f;
D)用户与商户的交易关系边Et:为用户节点和商户节点定义独立的共享的线性映射矩阵和用于把用户特征向量空间和商户特征向量空间从m维和l维映射到统一的f维向量空间;定义共享注意力向量at∈R2f;
2)再以如下公式进行图中各边的注意力系数计算:
a)基于Ed关系边的注意力系数:
b)基于Ep关系的注意力系数:
c)基于Es关系的注意力系数:
d)基于Et关系的注意力系数:
上面表达式中,符号||代表向量的拼接,下标i,j分别表示图中基于某种关系边相邻的两个节点,hi或hj都表示该节点所对应的特征向量取自之前生成的用户特征矩阵,在计算Et关系注意力系数时hi和hj特征向量一个取自用户特征矩阵,另一个取自商户特征矩阵;
3)最后通过如下公式进行信息聚合计算:
上述公式中,Nd(i)、Np(i)、Ns(i)、Nt(i)符号分别表示节点i通过设备关系边、支付关系边、社交关系边、交易关系边连接的一阶邻居;
上述步骤四中这一系列处理称为:多边注意力单元(MultiEdgeGAT);
五、上述步骤四只是完成了在某个时刻上图网络在空间层面的信息聚合,因为要考虑图网络的时间维上的动态性,就必须完成网络信息在时间维上的传递,本专利创新提出了一种使用多路GRU的方式在时间维上传递注意力参数的机制(称为:多路GRU单元-MultiGRU),结合空间层面的图注意力信息聚合机制(多边注意力单元-MultiEdgeGAT),形成了一个全新的处理单元,称之为动态注意力单元,具体操作如下:
1)因为图注意力机制会产生9个需要学习的参数,即5个共享线性映射矩阵和4个共享注意力向量,这里需要定9个独立的GRU单元负责在时间维上进行对于参数信息的传递,其分别是:
用来传递线性映射矩阵,和
用来传递注意力向量;对这些GRU单元的参数进行初始化;
2)这里的GRU传播公式如下:
因为GRU单元内部结构是一样的为了便于阐述举为例进行公式说明:
上述公式即完成了t-1时刻的注意力参数通过传递生成t时刻的注意力参数同理也可以以相同的结构,通过其他GRU从t-1时刻传递生成t时刻的其他8个注意力参数Wpt、Wst、上述公式中⊙表示哈达玛积,W~d、U~d、B~d为自身要学习的参数,同理其他GRU也有相类似的参数要学习;把上述9个GRU单元汇总在一起,称为多路GRU单元-MultiGRU;
3)把多边注意力单元和多路GRU单元合并,生成一个全新的处理单元,称之为动态注意力单元(DynamicGAT),合并公式如下:
为了使公式简化,更易于表达,把Wd、Wp、Ws、Wtc、Wtb这5个参数合并成W,把ad、ap、as、at这4个参数合并成a;
Wt,at=MultiGRU(Ht,Wt-1,at-1)
H′t’=MultiEdgeGAT(Ht,Wt,at);
六、上述步骤五阐述在时间轴上一个动态注意力单元的信息传递和信息聚合,这里可以很自然在每个时间点上进行空间上的多层聚合,则上述动态注意力单元的表达式可以表示成:
上式中上标l表示空间聚合的层级,这里每增加一层聚合意味着把图中节点再下一层邻接信息“压”向该节点,因此就很好的利用了多层邻接关系所蕴藏的信息,至此构建完成了一个既包含时间维度的信息传递,又包含空间维度多层聚合的动态可学习的图网络;
七、把上述动态注意力图网络最后一层最后一个时刻的输出表征通过Softmax进行激活映射成预测节点套利风险的概率P;
八、把上述所有步骤称为一次完整的学习迭代;进行学习迭代时,要把所需的信息从分布式数据库模块中同步入服务器内存并初始化所需学习的参数,然后进行多轮次的完整学习迭代;每次完整的学习迭代后仅针对有标签的节点Vlabeled,通过交叉熵损失函数,进行损失计算,以及Adam优化算法进行梯度更新,最后经过N次完整的学习迭代学习出动态注意力图网络所需的参数;完成动态注意力图网络的学习;
九、把学习好的动态注意力网络部署进风控决策模块中,进行在线的营销套利风险概率预测,设置概率决策阈值P=σ,当预测的风险概率大于σ时,判断为营销套利风险人群,并进行后续拦截等处理操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天翼电子商务有限公司,未经天翼电子商务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111040219.0/1.html,转载请声明来源钻瓜专利网。