[发明专利]一种基于文本监督注意力的多模态广告流行度预测方法在审

专利信息
申请号: 202111232184.0 申请日: 2021-10-22
公开(公告)号: CN113947436A 公开(公告)日: 2022-01-18
发明(设计)人: 钱洋;许华华;姜元春;柴一栋;刘业政;徐旺;凌海峰;熊迎秋 申请(专利权)人: 合肥工业大学
主分类号: G06Q30/02 分类号: G06Q30/02;G06F40/216;G06K9/62;G06N3/04;G06N3/08;G06Q10/04
代理公司: 安徽省合肥新安专利代理有限责任公司 34101 代理人: 陆丽莉;何梅生
地址: 230009 安*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 文本 监督 注意力 多模态 广告 流行 预测 方法
【权利要求书】:

1.一种基于文本监督注意力的多模态广告流行度预测方法,其特征是按如下步骤进行:

步骤1、构建多模态广告数据集合D,用|D|表示多模态广告数据集合D的数目,所述多模态广告数据集合D中任意第i条广告包含文本描述、图像、标签、标题、作者、时间的多模态信息,i∈[1,|D|];

步骤1.1、构建多模态广告数据集合D的文本信息集合,所述文本信息集合中第i条广告的文本信息,记为其中,wi,n表示第i条广告的文本信息di中第n个词汇,Ni表示文本信息di的总词汇量,n∈[1,Ni];

步骤1.2、构建多模态广告数据集合D的视觉信息集合,所述视觉信息集合中第i条广告的视觉信息Ii,记为其中,pi,m表示第i条广告的视觉信息Ii中第m个图片,Mi表示视觉信息Ii的总图片数,m∈[1,Mi];

步骤1.3、构建多模态广告数据集合D的其他辅助信息集合,其中,第i条广告的标签信息集合记为li,第i条广告的标题信息集合记为ti,第i条广告的作者信息集合记为ai,第i条广告的时间信息集合记为Ti

步骤2、提取多模态广告的特征;

步骤2.1、基于降噪主题模型获取文本信息的特征表示;

步骤2.1.1、定义所有文本信息集合的主题分布为θ={θ12,…,θi,…,θ|D|},其中,θi表示第i条广告的文本信息di的主题分布,且服从参数为α的狄利克雷分布,定义第i条广告的文本信息di的主题分布θi由K个与流行度预测相关的主题{θi1i2,…,θik,…,θiK}和一个背景主题组成,其中,θik表示第i条广告的文本信息di在第k个与流行度预测相关的主题上的概率分布值,k∈[1,K];

步骤2.1.2、令φk表示第k个主题词分布,且φk服从参数为β0的狄利克雷分布,并有φk={φk1k2,…φkv,…φkV},其中,φkv表示第v个词汇被分配给第k个主题的概率,v∈[1,V],V表示所有广告的文本信息中不重复的词汇总数;

令表示背景主题下的词分布,且服从参数为β1的狄利克雷分布,并有其中,表示第v个词汇被分配给背景主题的概率;

步骤2.1.3、定义二元指示变量b=(b1,b2,...,bi,...,b|D|),其中,bi表示第i个广告的文本信息di中所有词汇的主题所属情况,并有其中,bin第i条广告的文本信息di中第n个词汇wi,n的主题所属情况,且服从伯努利分布;

若bin=1,表示第i条广告的文本信息di中第n个词汇wi,n属于与流行度预测相关的主题,则定义第i条广告的文本信息di中第n个词汇的与流行度预测相关的主题编号为zin,且服从参数为θi的多项式分布;定义第i条广告的文本信息di的第n个词汇wi,n服从参数为的多项式分布,其中,表示第i条广告的文本信息di的第n个词汇wi,n所属的与流行度预测相关的第zin个主题下的词概率分布;

若bin=0,表示第i条广告的文本信息di的第n个词汇wi,n属于背景主题;定义第i条广告的文本信息di的第n个词汇wi,n服从参数为的多项式分布;

步骤2.1.4、使用式(1)~式(3)所示的坍塌式吉布斯抽样分别计算第i条广告的文本信息di的主题分布θi、第k个与流行度预测相关的主题下的词分布φk和背景主题下的词分布

式(1)~式(3)中,表示第i条广告的文本信息di中分配到第k个与流行度预测相关的主题下的词汇的数量;表示二元变量b为1时,所有文本信息中第v个词汇分配到第k个与流行度预测相关的主题下的数量;表示二元变量b为0时,所有文本信息中第v个词汇分配到背景主题下的数量;

根据第k个与流行度预测相关的主题下的词分布φk,取概率最大的前E个词汇对第k个与流行度预测相关的主题进行向量表征,并结合第i条广告的文本信息di的主题分布θi,得到文本信息的特征矩阵其中,表示第i条广告的文本信息di中第k个与流行度预测相关的主题的特征表示;

步骤2.2、通过预训练的VGG-16网络来提取图片区域特征;

将第i条广告的视觉信息Ii的第m张图片pi,m划分为Z个区域,得到图片区域集合其中,表示第i条广告的视觉信息Ii的第m张图片pi,m中第z个区域;将第z个区域输入VGG-16网络,并输出第m张图片pi,m中第z个区域的特征表示vi,m,z,从而得到图片区域的特征表示集合Vi,m=[vi,m,1,…,vi,m,z,…,vi,m,Z];

步骤2.3、获取其他辅助信息的特征表示;

步骤2.3.1、获取标签和标题信息的特征表示;

将第i条广告的标签信息li的第j个标签li,j表示为独热编码yi,j,将第i条广告的标签信息li的所有标签均表示为相应的独热编码并构成编码向量后输入到LSTM模型,得到标签信息li的特征向量;

由标签信息li的特征向量构造标签信息li的标签特征矩阵并进行均值池操作后得到第i条广告的标签信息li的特征表示filabel;同理,得到第i条广告的标题信息ti的特征表示fititle

步骤2.3.2、获取作者信息的特征表示;

使用作者信息集合ai的粉丝数fifollowers,作者信息集合ai的关注数fifollowings,作者信息集合ai的作品数fiworks作为第i条广告的作者信息集合ai的特征表示,记为fiauthor=[fifollowers,fifollowings,fiworks];

步骤2.3.3、获取时间信息的特征表示;

将第i条广告的时间信息集合Ti的小时fihour、星期fiweek、日fiday、月fimonth、年fiyear作为第i条广告的时间信息Ti的特征表示作,记为fitime=[fihour,fiweek,fiday,fimonth,fiyear];

步骤3、引入基于文本的注意力机制;

步骤3.1、引入如式(4)和式(5)所示的注意力机制,从而利用式(6)得到第i条广告的文本信息di的特征表示Q为文本特征维度:

式(4)~式(6)中,为词级别的文本特征表示的隐表示,S为隐藏层维度,Wtopic为隐表示的权重矩阵,btopic为隐表示的偏置向量,αi,k∈R为文本特征表示的注意力得分,Wa为文本注意力得分的权重矩阵,tanh表示正切激活函数,表示文本特征表示的隐表示,k′∈[1,K];

步骤3.2、通过基于文本的注意力机制得到每张图片的特征表示;

利用式(7)和式(8)分别得到结合文本信息的图片区域特征表示和第z个区域的注意力得分αi,m,z∈R,从而利用式(9)得到第m张图片pi,m的特征表示

式(7)~式(9)中,Wregion为图片区域特征表示的权重矩阵,Wtext为文本特征表示的权重矩阵,Wv为图片区域注意力得分的权重矩阵;表示第i条广告的视觉信息Ii中第m张图片pi,m中第z′个区域的特征表示,z′∈[1,Z],⊙表示元素乘积;

步骤3.3、使用注意力机制融合多张图片的特征,最终得到第i条广告的视觉信息Ii的特征表示

利用式(10)得到第i条广告的视觉信息Ii中第m张图片pi,m的隐特征表示hi,m∈RQ,利用式(11)计算第m张图片pi,m的注意力得分ai,m∈R,利用式(12)得到最终学习到的第i条广告的视觉信息Ii的特征表示

式(10)~式(12)中,Wimage为图片隐特征表示的权重矩阵,bimage为图片隐特征表示的偏置向量,Wh为图片注意力得分的权重矩阵;hi,m′表示第i条广告的视觉信息Ii中第m′张图片pi,m′的隐特征表示,m′∈[1,Mi];

步骤4、融合多模态广告的文本与视觉特征;

利用式(13)所示的线性函数对文本特征与视觉特征进行融合,得到第i条广告的融合表示

式(13)中,为外积;[]表示向量矩阵的线性化;

步骤5、利用融合后的全局特征预测流行度得分;

步骤5.1、将连接起来,得到第i条广告的全局特征figlobal,从而得到所有广告的全局特征fglobal并输入如式(14)所示的分类器中预测流行度得分

式(14)中,Wg和bg为分类器的权重矩阵与偏差向量;

步骤5.2、采用如式(15)所示的二元交叉熵作为目标函数J:

式(15)中,C表示所述多模态数据集合D中作为训练集的数据条数,yc表示训练集中第c条广告的真实流行度得分,表示训练集中第c条广告的预测流行度得分;1<C<|D|;

步骤5.3、设置最大迭代次数epoch_number,利用反向传播和梯度下降法对目标函数J进行训练,使得J达到最小,当迭代次数达到epoch_number时,停止训练,从而得到最优预测模型,用于对所输入的多模态广告数据进行流行度得分的预测。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111232184.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top