[发明专利]一种基于多任务学习的短视频多行为点击预测方法在审
申请号: | 202211380652.3 | 申请日: | 2022-11-04 |
公开(公告)号: | CN115905616A | 公开(公告)日: | 2023-04-04 |
发明(设计)人: | 顾亦然;周永波;王雨;徐泽彬;李晓芳;彭家旭 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06F16/735 | 分类号: | G06F16/735;G06F16/783;G06F16/78;G06V20/40;G06V10/764;G06V10/774;G06Q10/06 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 朱小兵 |
地址: | 210033 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 任务 学习 视频 行为 点击 预测 方法 | ||
1.一种基于多任务学习的短视频多行为点击预测方法,其特征在于,包括如下步骤:
S1、分别对用户行为数据集、短视频数据集提取基础特征,获得用户基础特征集、短视频基础特征集;之后对用户基础特征集、短视频基础特征集选取特征合并,分别获得用户基本特征、以及短视频基本特征;
S2、从用户基础特征集中提取的用户行为特征按照时间先后的顺序进行划分获得用户观看序列,进一步获得所有用户的观看序列,以所有用户观看序列为输入、其对应的短视频词向量特征为输出,构建并训练获得序列特征提取模型;
S3、根据用户观看序列,生成用户观看路径图,以用户观看序列为输入、用户观看序列向量特征为输出,构建并训练用户序列特征提取模型;以用户观看路径图为输入,用户潜在观看序列向量特征为输出,构建并训练用户潜在观看序列特征提取模型;
S4、以用户基本特征、短视频基本特征、短视频词向量特征、用户观看序列向量特征、用户潜在观看序列向量特征为输入、其对应的用户行为预测概率为输出,构建并训练用户多行为点击预测模型,并在训练过程中用户行为进行分配权重。
2.根据权利要求1所述的一种基于多任务学习的短视频多行为点击预测方法,其特征在于,步骤S1包括如下子步骤:
S101、对用户行为数据集中用户ID特征、以及用户行为特征进行提取,获得用户基础特征集;对短视频数据集中的短视频特征、短视频多模态信息进行特征提取,获得短视频基础特征集;
S102、从用户ID特征、用户行为特征选取特征进行合并,获得用户基本特征;将用户ID特征、短视频特征进行合并,获得短视频基本特征。
3.根据权利要求2所述的一种基于多任务学习的短视频多行为点击预测方法,其特征在于,所述步骤S2包括如下子步骤:
S201、从用户基础特征集中提取的用户行为特征按照时间先后的顺序进行划分获得用户观看序列为:
W1=[w1,w2,...,wT],
其中wi表示在第i个时间戳观看的视频,i=1,2,...,T;
S202、获得所有m个用户的观看序列为:
Wm=[W1,W2,...,Wm],
S203、以m个用户的观看序列为输入、其对应的短视频词向量特征为输出,利用词嵌入方法Word2Vec,构建并训练获得序列特征提取模型。
4.根据权利要求3所述的一种基于多任务学习的短视频多行为点击预测方法,其特征在于,步骤S3中,生成用户观看路径图具体为:
根据用户的观看序列W1=[w1,w2,...,wT],生成其对应的用户观看路径图G=(V,E),其中V表示图中的短视频节点集合,E表示图中的时间观看顺序边集合。
5.根据权利要求4所述的一种基于多任务学习的短视频多行为点击预测方法,其特征在于,步骤S3中,构建用户潜在观看序列模型时,利用Random Walk算法,从用户观看路径图中计算用户潜在观看序列的概率如下式:
其中,M是G的邻接矩阵,Mi,j表示从节点i指向节点j的加权边,N+(vj)表示的是所有节点vi的下一跳节点集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211380652.3/1.html,转载请声明来源钻瓜专利网。