[发明专利]用户特征的提取方法、装置、设备及存储介质在审
申请号: | 202011162452.1 | 申请日: | 2020-10-27 |
公开(公告)号: | CN112231572A | 公开(公告)日: | 2021-01-15 |
发明(设计)人: | 余志伟 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 徐立 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 特征 提取 方法 装置 设备 存储 介质 | ||
本申请公开了一种用户特征的提取方法、装置、设备及存储介质,涉及人工智能的机器学习技术领域。所述方法包括:获取目标用户的内容阅览序列,该目标用户的内容阅览序列中包括目标用户阅览过的n个内容,n为正整数;通过语义抽取模型对内容阅览序列进行基于上下文的特征提取处理,得到n个内容分别对应的基于上下文的内容向量;根据n个内容分别对应的基于上下文的内容向量,生成目标用户的用户向量。本申请在用户向量的提取过程中,充分考虑了内容在内容阅览序列中的上下文信息,使得最终得到的用户向量能够更加准确地反映出用户在阅览内容之间的相关性、顺序或偏好等维度的特征,提升了用户向量的准确度。
技术领域
本申请实施例涉及人工智能的机器学习技术领域,特别涉及一种用户特征的提取方法、装置、设备及存储介质。
背景技术
目前,在一些内容推送场景(如文章推送、新闻推送等场景)下,会向目标用户推送其相似用户阅览过的内容,从而提升推送内容的点击率。
在相关技术中,运用机器学习技术基于目标用户的历史阅览内容,确定出能够反映该目标用户的用户特征的用户向量,然后基于不同用户的用户向量之间的相似度,确定出目标用户的相似用户,之后就可实现向目标用户推送其相似用户阅览过的内容。
因此,用户向量的提取至关重要,但目前方案提取得到的用户向量不够准确。
发明内容
本申请实施例提供了一种用户特征的提取方法、装置、设备及存储介质,能够提升提取得到的用户向量的准确度,更准确地反映出用户特征。所述技术方案如下:
根据本申请实施例的一个方面,提供了一种用户特征的提取方法,所述方法包括:
获取目标用户的内容阅览序列,所述目标用户的内容阅览序列中包括所述目标用户阅览过的n个内容,所述n为正整数;
通过语义抽取模型对所述内容阅览序列进行基于上下文的特征提取处理,得到所述n个内容分别对应的基于上下文的内容向量;其中,所述基于上下文的内容向量是指考虑所述内容在所述内容阅览序列中的上下文信息的特征向量表示;
根据所述n个内容分别对应的基于上下文的内容向量,生成所述目标用户的用户向量,所述目标用户的用户向量用于表征所述目标用户的用户特征。
根据本申请实施例的一个方面,提供了一种用户特征的提取装置,所述装置包括:
阅览序列获取模块,用于获取目标用户的内容阅览序列,所述目标用户的内容阅览序列中包括所述目标用户阅览过的n个内容,所述n为正整数;
内容向量提取模块,用于通过语义抽取模型对所述内容阅览序列进行基于上下文的特征提取处理,得到所述n个内容分别对应的基于上下文的内容向量;其中,所述基于上下文的内容向量是指考虑所述内容在所述内容阅览序列中的上下文信息的特征向量表示;
用户向量生成模块,用于根据所述n个内容分别对应的基于上下文的内容向量,生成所述目标用户的用户向量,所述目标用户的用户向量用于表征所述目标用户的用户特征。
根据本申请实施例的一个方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现上述用户特征的提取方法。
根据本申请实施例的一个方面,提供了一种计算机可读存储介质,所述可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现上述用户特征的提取方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011162452.1/2.html,转载请声明来源钻瓜专利网。