[发明专利]数据确定方法、装置、电子设备及存储介质在审
申请号: | 202111565403.7 | 申请日: | 2021-12-20 |
公开(公告)号: | CN114330519A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 林伟;陈超超 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00 |
代理公司: | 北京中博世达专利商标代理有限公司 11274 | 代理人: | 申健 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 确定 方法 装置 电子设备 存储 介质 | ||
本公开关于一种数据确定方法、装置、电子设备及存储介质,能够从多个方面刻画用户兴趣,提高召回率;涉及大数据处理技术领域。该方法包括:获取目标对象针对目标资源的交互信息;根据所述交互信息确定所述目标对象的特征;所述目标对象的特征包括多个维度的特征;确定多组权重系数,每组权重系数包括与所述多个维度的特征对应的多个权重系数;对每组权重系数与所述目标对象的特征进行加权处理,得到所述目标对象的多个向量;其中,目标对象的每个向量对应一组权重系数;对所述目标对象的每个向量检索相关性符合预设要求的候选资源,根据所述目标对象的多个向量中每个向量对应的候选资源确定所述目标对象对应的数据召回结果。
技术领域
本公开涉及大数据处理技术领域,尤其涉及一种数据确定方法、数据确定装置、电子设备、计算机可读存储介质及计算机程序产品。
背景技术
数据召回指的是从具有上百万条数据的数据库中确定出用户最感兴趣的一部分数据的过程。数据具体可以包括图片、文本、视频等,也可以包括目标资源,例如广告、商品等。确定出的数据会经过排序后展现给用户,对数据检索、信息推广等均具有至关重要的作用。
相关技术中,数据召回主要采用:基于向量化的召回方案,基于标签的召回方案,以及基于特征的召回方案。其中,基于向量化的召回方案通过神经网络为用户和广告各学习一个向量表达,再计算用户的向量与广告的向量的相关性,对相关性高的目标广告进行召回。然而,用户的兴趣往往是多样的,上述基于向量化的召回方案难以刻画用户多方面的兴趣,其召回结果偏向热门广告,缺乏准确性。
发明内容
本公开提供一种数据确定方法、装置、电子设备及存储介质,以至少解决相关技术中数据召回的准确性低的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种数据确定方法,包括:获取目标对象针对目标资源的交互信息;根据交互信息确定目标对象的特征;目标对象的特征包括多个维度的特征;确定多组权重系数,每组权重系数包括与多个维度的特征对应的多个权重系数;对每组权重系数与目标对象的特征进行加权处理,得到目标对象的多个向量;其中,目标对象的每个向量对应一组权重系数;对目标对象的每个向量检索相关性符合预设要求的候选资源,根据目标对象的多个向量中每个向量对应的候选资源确定目标对象对应的数据召回结果。
本公开的实施例提供的技术方案至少带来以下有益效果:
在本实施例的技术方案中,根据目标对象的特征可以得到目标对象的多个向量,多个向量可以从多个方面刻画用户兴趣,从而使得召回的数据能够更加全面地匹配用户兴趣,提高召回率。同时,将一个目标对象通过多个向量来表达,能增大不同用户之间的差异,使得召回的数据更加满足用户的个性化需求,从而提高数据召回的准确性。
在一种示例性实施方式中,对每组权重系数与所述目标对象的特征进行加权处理,得到目标对象的多个向量包括:将所述目标对象的特征输入预置的多个特征选择网络,每个特征选择网络中包含一组权重系数,通过所述特征选择网络的权重系数为所述目标对象的特征进行加权,获得每个所述特征选择网络输出的向量。
上述特征选择网络为一机器学习模型,通过机器学习模型的方式为目标对象的特征进行加权,可以提高权重系数的准确性,并且该权重系数可以不断进行更新,保证可用性和有效性。
在一种示例性实施方式中,上述方法还包括:获取样本特征以及所述样本特征对应的标签信息;其中,所述样本特征中包含样本对象特征以及样本资源特征;所述标签信息用于表征所述样本对象特征对应的样本对象与所述样本资源特征对应的样本资源之间是否存在交互行为;将所述样本特征中的样本对象特征输入多个第一模型,获得每个所述第一模型输出的样本向量;确定所述样本特征中样本资源特征对应的样本资源向量;分别计算每个样本向量与所述样本资源向量的相似度,确定所述相似度最高的目标样本向量;根据所述目标样本向量和所述样本资源向量,确定预估交互行为发生概率;根据所述预估交互行为发生概率和所述样本特征对应的标签信息,训练所述多个第一模型,直至满足预设训练结束条件,得到所述多个特征选择网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111565403.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种车辆部件的气密性检测方法及设备
- 下一篇:一种蓄电池房间环境保障系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置