[发明专利]一种基于多任务学习的短视频多行为点击预测方法在审
申请号: | 202211380652.3 | 申请日: | 2022-11-04 |
公开(公告)号: | CN115905616A | 公开(公告)日: | 2023-04-04 |
发明(设计)人: | 顾亦然;周永波;王雨;徐泽彬;李晓芳;彭家旭 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06F16/735 | 分类号: | G06F16/735;G06F16/783;G06F16/78;G06V20/40;G06V10/764;G06V10/774;G06Q10/06 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 朱小兵 |
地址: | 210033 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 任务 学习 视频 行为 点击 预测 方法 | ||
本发明公开了一种基于多任务学习的短视频多行为点击预测方法,步骤如下:提取用户基本特征和短视频基本特征;引入词嵌入模型和图嵌入模型充分学习用户历史行为序列中的时序信息,提取出序列特征;建立MMOE多任务模型学习不同行为的联系与差异;并在此基础上引入FM模型学习低阶特征交互;对用户进行查看评论,点赞,点击头像,转发等行为分配不同的权重,进行加权平均,预测用户对短视频点击行为的概率值。本发明引入词嵌入模型和图嵌入模型提取出序列特征,在MMOE模型基础上引入FM模型,不仅可以学习不同行为的联系与差异,而且可以学习低阶特征交互,使模型具有低阶特征的记忆性能和高阶特征的泛化性能,提高点击预测准确性。
技术领域
本发明属于信息推荐领域,特别涉及一种基于多任务学习的短视频多行为点击预测方法。
背景技术
近年来,随着大数据时代的到来,产生了大量的短视频信息,导致人们无法从中获取自己喜爱的视频,迫切需要一种可以进行个性化视频推荐的系统,因此,短视频个性化推荐系统应运而生,点击率预测是推荐系统中的关键问题。短视频个性化推荐系统通过预测用户点击待推荐短视频的概率,然后对待推荐列表进行排序,将预测概率最高的短视频推荐给用户,从而达到个性化推荐的目的,提升用户观看体验,进而增加用户粘性,在提升流量的同时增加平台收益。
目前短视频点击行为预测主流的方法是基于深度学习方法,对于多个不相关的学习任务,一般选择对每个任务分别建立模型,但是当多个任务间存在某种潜在关联时,比如,只有先查看评论才可以发表评论,如果仍采用单独建模的思路,则忽略了多个任务的相关性;基于深度学习模型都是将大规模稀疏输入特征映射到低维嵌入向量,然后转换为固定长度向量,使得用户兴趣表示具有不变性,忽略了现实生活中用户的行为可能随着时间发生动态变化这一事实。
发明内容
本发明的目的在于:提供一种基于多任务学习的短视频多行为点击预测方法,以解决现有技术的问题。
为实现上述目的,本发明提供如下技术方案:一种基于多任务学习的短视频多行为点击预测方法,包括如下步骤:
S1、分别对用户行为数据集、短视频数据集提取基础特征,获得用户基础特征集、短视频基础特征集;之后对用户基础特征集、短视频基础特征集选取特征合并,分别获得用户基本特征、以及短视频基本特征;
S2、从用户基础特征集中提取的用户行为特征按照时间先后的顺序进行划分获得用户观看序列,进一步获得所有用户的观看序列,以所有用户观看序列为输入、其对应的短视频词向量特征为输出,构建并训练获得序列特征提取模型;
S3、根据用户观看序列,生成用户观看路径图,以用户观看序列为输入、用户观看序列向量特征为输出,构建并训练用户序列特征提取模型;以用户观看路径图为输入,用户潜在观看序列向量特征为输出,构建并训练用户潜在观看序列特征提取模型;
S4、以用户基本特征、短视频基本特征、短视频词向量特征、用户观看序列向量特征、用户潜在观看序列向量特征为输入、其对应的用户行为预测概率为输出,构建并训练用户多行为点击预测模型,并在训练过程中用户行为进行分配权重。
进一步地,前述的步骤S1包括如下子步骤:
S101、对用户行为数据集中用户ID特征、以及用户行为特征进行提取,获得用户基础特征集;对短视频数据集中的短视频特征、短视频多模态信息进行特征提取,获得短视频基础特征集;
S102、从用户ID特征、用户行为特征选取特征进行合并,获得用户基本特征;将用户ID特征、短视频特征进行合并,获得短视频基本特征。
进一步地,前述的步骤S2包括如下子步骤:
S201、从用户基础特征集中提取的用户行为特征按照时间先后的顺序进行划分获得用户观看序列为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211380652.3/2.html,转载请声明来源钻瓜专利网。