[发明专利]一种基于文本监督注意力的多模态广告流行度预测方法在审
申请号: | 202111232184.0 | 申请日: | 2021-10-22 |
公开(公告)号: | CN113947436A | 公开(公告)日: | 2022-01-18 |
发明(设计)人: | 钱洋;许华华;姜元春;柴一栋;刘业政;徐旺;凌海峰;熊迎秋 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06F40/216;G06K9/62;G06N3/04;G06N3/08;G06Q10/04 |
代理公司: | 安徽省合肥新安专利代理有限责任公司 34101 | 代理人: | 陆丽莉;何梅生 |
地址: | 230009 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 文本 监督 注意力 多模态 广告 流行 预测 方法 | ||
1.一种基于文本监督注意力的多模态广告流行度预测方法,其特征是按如下步骤进行:
步骤1、构建多模态广告数据集合D,用|D|表示多模态广告数据集合D的数目,所述多模态广告数据集合D中任意第i条广告包含文本描述、图像、标签、标题、作者、时间的多模态信息,i∈[1,|D|];
步骤1.1、构建多模态广告数据集合D的文本信息集合,所述文本信息集合中第i条广告的文本信息,记为其中,wi,n表示第i条广告的文本信息di中第n个词汇,Ni表示文本信息di的总词汇量,n∈[1,Ni];
步骤1.2、构建多模态广告数据集合D的视觉信息集合,所述视觉信息集合中第i条广告的视觉信息Ii,记为其中,pi,m表示第i条广告的视觉信息Ii中第m个图片,Mi表示视觉信息Ii的总图片数,m∈[1,Mi];
步骤1.3、构建多模态广告数据集合D的其他辅助信息集合,其中,第i条广告的标签信息集合记为li,第i条广告的标题信息集合记为ti,第i条广告的作者信息集合记为ai,第i条广告的时间信息集合记为Ti;
步骤2、提取多模态广告的特征;
步骤2.1、基于降噪主题模型获取文本信息的特征表示;
步骤2.1.1、定义所有文本信息集合的主题分布为θ={θ1,θ2,…,θi,…,θ|D|},其中,θi表示第i条广告的文本信息di的主题分布,且服从参数为α的狄利克雷分布,定义第i条广告的文本信息di的主题分布θi由K个与流行度预测相关的主题{θi1,θi2,…,θik,…,θiK}和一个背景主题组成,其中,θik表示第i条广告的文本信息di在第k个与流行度预测相关的主题上的概率分布值,k∈[1,K];
步骤2.1.2、令φk表示第k个主题词分布,且φk服从参数为β0的狄利克雷分布,并有φk={φk1,φk2,…φkv,…φkV},其中,φkv表示第v个词汇被分配给第k个主题的概率,v∈[1,V],V表示所有广告的文本信息中不重复的词汇总数;
令表示背景主题下的词分布,且服从参数为β1的狄利克雷分布,并有其中,表示第v个词汇被分配给背景主题的概率;
步骤2.1.3、定义二元指示变量b=(b1,b2,...,bi,...,b|D|),其中,bi表示第i个广告的文本信息di中所有词汇的主题所属情况,并有其中,bin第i条广告的文本信息di中第n个词汇wi,n的主题所属情况,且服从伯努利分布;
若bin=1,表示第i条广告的文本信息di中第n个词汇wi,n属于与流行度预测相关的主题,则定义第i条广告的文本信息di中第n个词汇的与流行度预测相关的主题编号为zin,且服从参数为θi的多项式分布;定义第i条广告的文本信息di的第n个词汇wi,n服从参数为的多项式分布,其中,表示第i条广告的文本信息di的第n个词汇wi,n所属的与流行度预测相关的第zin个主题下的词概率分布;
若bin=0,表示第i条广告的文本信息di的第n个词汇wi,n属于背景主题;定义第i条广告的文本信息di的第n个词汇wi,n服从参数为的多项式分布;
步骤2.1.4、使用式(1)~式(3)所示的坍塌式吉布斯抽样分别计算第i条广告的文本信息di的主题分布θi、第k个与流行度预测相关的主题下的词分布φk和背景主题下的词分布
式(1)~式(3)中,表示第i条广告的文本信息di中分配到第k个与流行度预测相关的主题下的词汇的数量;表示二元变量b为1时,所有文本信息中第v个词汇分配到第k个与流行度预测相关的主题下的数量;表示二元变量b为0时,所有文本信息中第v个词汇分配到背景主题下的数量;
根据第k个与流行度预测相关的主题下的词分布φk,取概率最大的前E个词汇对第k个与流行度预测相关的主题进行向量表征,并结合第i条广告的文本信息di的主题分布θi,得到文本信息的特征矩阵其中,表示第i条广告的文本信息di中第k个与流行度预测相关的主题的特征表示;
步骤2.2、通过预训练的VGG-16网络来提取图片区域特征;
将第i条广告的视觉信息Ii的第m张图片pi,m划分为Z个区域,得到图片区域集合其中,表示第i条广告的视觉信息Ii的第m张图片pi,m中第z个区域;将第z个区域输入VGG-16网络,并输出第m张图片pi,m中第z个区域的特征表示vi,m,z,从而得到图片区域的特征表示集合Vi,m=[vi,m,1,…,vi,m,z,…,vi,m,Z];
步骤2.3、获取其他辅助信息的特征表示;
步骤2.3.1、获取标签和标题信息的特征表示;
将第i条广告的标签信息li的第j个标签li,j表示为独热编码yi,j,将第i条广告的标签信息li的所有标签均表示为相应的独热编码并构成编码向量后输入到LSTM模型,得到标签信息li的特征向量;
由标签信息li的特征向量构造标签信息li的标签特征矩阵并进行均值池操作后得到第i条广告的标签信息li的特征表示filabel;同理,得到第i条广告的标题信息ti的特征表示fititle;
步骤2.3.2、获取作者信息的特征表示;
使用作者信息集合ai的粉丝数fifollowers,作者信息集合ai的关注数fifollowings,作者信息集合ai的作品数fiworks作为第i条广告的作者信息集合ai的特征表示,记为fiauthor=[fifollowers,fifollowings,fiworks];
步骤2.3.3、获取时间信息的特征表示;
将第i条广告的时间信息集合Ti的小时fihour、星期fiweek、日fiday、月fimonth、年fiyear作为第i条广告的时间信息Ti的特征表示作,记为fitime=[fihour,fiweek,fiday,fimonth,fiyear];
步骤3、引入基于文本的注意力机制;
步骤3.1、引入如式(4)和式(5)所示的注意力机制,从而利用式(6)得到第i条广告的文本信息di的特征表示Q为文本特征维度:
式(4)~式(6)中,为词级别的文本特征表示的隐表示,S为隐藏层维度,Wtopic为隐表示的权重矩阵,btopic为隐表示的偏置向量,αi,k∈R为文本特征表示的注意力得分,Wa为文本注意力得分的权重矩阵,tanh表示正切激活函数,表示文本特征表示的隐表示,k′∈[1,K];
步骤3.2、通过基于文本的注意力机制得到每张图片的特征表示;
利用式(7)和式(8)分别得到结合文本信息的图片区域特征表示和第z个区域的注意力得分αi,m,z∈R,从而利用式(9)得到第m张图片pi,m的特征表示
式(7)~式(9)中,Wregion为图片区域特征表示的权重矩阵,Wtext为文本特征表示的权重矩阵,Wv为图片区域注意力得分的权重矩阵;表示第i条广告的视觉信息Ii中第m张图片pi,m中第z′个区域的特征表示,z′∈[1,Z],⊙表示元素乘积;
步骤3.3、使用注意力机制融合多张图片的特征,最终得到第i条广告的视觉信息Ii的特征表示
利用式(10)得到第i条广告的视觉信息Ii中第m张图片pi,m的隐特征表示hi,m∈RQ,利用式(11)计算第m张图片pi,m的注意力得分ai,m∈R,利用式(12)得到最终学习到的第i条广告的视觉信息Ii的特征表示
式(10)~式(12)中,Wimage为图片隐特征表示的权重矩阵,bimage为图片隐特征表示的偏置向量,Wh为图片注意力得分的权重矩阵;hi,m′表示第i条广告的视觉信息Ii中第m′张图片pi,m′的隐特征表示,m′∈[1,Mi];
步骤4、融合多模态广告的文本与视觉特征;
利用式(13)所示的线性函数对文本特征与视觉特征进行融合,得到第i条广告的融合表示
式(13)中,为外积;[]表示向量矩阵的线性化;
步骤5、利用融合后的全局特征预测流行度得分;
步骤5.1、将连接起来,得到第i条广告的全局特征figlobal,从而得到所有广告的全局特征fglobal并输入如式(14)所示的分类器中预测流行度得分
式(14)中,Wg和bg为分类器的权重矩阵与偏差向量;
步骤5.2、采用如式(15)所示的二元交叉熵作为目标函数J:
式(15)中,C表示所述多模态数据集合D中作为训练集的数据条数,yc表示训练集中第c条广告的真实流行度得分,表示训练集中第c条广告的预测流行度得分;1<C<|D|;
步骤5.3、设置最大迭代次数epoch_number,利用反向传播和梯度下降法对目标函数J进行训练,使得J达到最小,当迭代次数达到epoch_number时,停止训练,从而得到最优预测模型,用于对所输入的多模态广告数据进行流行度得分的预测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111232184.0/1.html,转载请声明来源钻瓜专利网。