[发明专利]一种基于异构图嵌入技术的广告受众基础属性预估方法在审
申请号: | 202011439950.6 | 申请日: | 2020-12-10 |
公开(公告)号: | CN112529621A | 公开(公告)日: | 2021-03-19 |
发明(设计)人: | 印鉴;蒙权;曹志平 | 申请(专利权)人: | 中山大学;广州通达汽车电气股份有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 刘俊 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 构图 嵌入 技术 广告 受众 基础 属性 预估 方法 | ||
1.一种基于异构图嵌入技术的广告受众基础属性预估方法,其特征在于,包括以下步骤:
S1:根据所有广告受众的历史点击行为,构建一张广告受众的点击行为记录的异构图,并基于异构图嵌入表示技术为这些广告信息生成各自的向量表示,其中广告信息包括素材id、广告id、广告主id;
S2:划分数据集,按照广告受众的基础属性是否已知将原始数据集分为两类,其中已知基础属性的这类数据称为训练集,用于训练预测模型,另一类数据称为测试集,用于预测其未知的基础属性,其中,广告受众的基础属性是年龄和性别;
S3:将训练集当中广告受众的历史点击行为作为LSTM预测模型的输入特征,年龄和性别作为对应特征的预测结果标签,对LSTM神经网络进行训练,得到一个根据广告受众的点击行为预测其基础属性的预测模型。
S4:将测试集当中广告受众的历史点击行为输入训练好的预测模型,预估得到这些用户的基础属性。
2.根据权利要求1所述的基于异构图嵌入技术的广告受众基础属性预估方法,其特征在于,所述步骤S1中,构建广告受众的点击行为记录的异构图的过程是:
S11:生成异构图的节点:每个类型的每一个不同的id编号都作为异构图的一个节点;
S12:用边连接异构图的节点:四类节点类型之间存在3种边的关系:用户与广告素材的点击关系、广告素材与广告的从属关系、广告与广告主的发布关系;如果节点之间存在上述的三种关系中的任意一种,则将该两个节点用一条边连接起来。
3.根据权利要求2所述的基于异构图嵌入技术的广告受众基础属性预估方法,其特征在于,所述步骤S1中,于异构图嵌入表示技术为这些广告信息生成各自的向量表示的过程包括异构图采样和SkipGram神经网络训练。
4.根据权利要求3所述的基于异构图嵌入技术的广告受众基础属性预估方法,其特征在于,所述异构图采样的具体过程是:
每个广告受众id均作为开头节点按照设定好的元路径进行游走W次,每次游走L步;将每个游走到的节点依次登记下来,即是包含各类节点类型的节点序列语料库。
5.根据权利要求4所述的基于异构图嵌入技术的广告受众基础属性预估方法,其特征在于,所述SkipGram神经网络训练的过程是:
将节点序列语料库输入SkipGram神经网络,训练得到语料库中的每个节点的n维向量表示;训练的目标是使得各个节点的向量表示能够保持节点在语料库中的近邻信息,训练模型优化的公式为:
其中ct为v的上下文节点,分母ut∈Vt,即负采样时考虑了节点的类型;训练好之后,得到每个节点的n维向量表示。
6.根据权利要求5所述的基于异构图嵌入技术的广告受众基础属性预估方法,其特征在于,步骤S2中,数据集划分的过程是:
按照广告受众的基础属性是否已知将原始数据集分为两类;其中已知基础属性的这类数据称为训练集,训练集的广告受众点击行为作为训练模型的特征,特征对应的基础属性作为训练的标签,将特征与对应的标签用于训练LSTM神经网络得到预测模型;另一类数据称为测试集,用于训练好的预测模型预测其未知的基础属性。
7.根据权利要求6所述的基于异构图嵌入技术的广告受众基础属性预估方法,其特征在于,步骤S3中,将训练集的数据处理为后续的LSTM可以识别的特征向量及其标签,具体步骤为:
1)对每一个广告受众,分别把该用户的三个特征均按时间先后顺序排列起来,三个特征的长度均为p个时间步;若有用户的特征超过p个,则保留最近的p个,若不足p个,则取最近的补足p个;
2)将每位广告受众的3个特征转为特征向量,即将每个广告受众的三个特征的历史时间序列中的每个节点替换为其n维向量来表示。每位广告受众的3个特征向量将作为训练模型的输入特征;
3)将每位广告受众的基础属性作为该用户的3个特征所对应的标签,用于LSTM神经网络的监督训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学;广州通达汽车电气股份有限公司,未经中山大学;广州通达汽车电气股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011439950.6/1.html,转载请声明来源钻瓜专利网。