[发明专利]基于散列的有效用户建模在审
申请号: | 202080019076.2 | 申请日: | 2020-03-06 |
公开(公告)号: | CN113544659A | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 周鹏;朱英南;赵湘源;金洪会;H.李 | 申请(专利权)人: | 三星电子株式会社 |
主分类号: | G06F16/2455 | 分类号: | G06F16/2455;G06Q30/02 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 邵亚丽 |
地址: | 韩国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 有效 用户 建模 | ||
在一个实施例中,一种方法包括接收用户行为数据和与用户行为数据相关联的上下文信息,该上下文信息包括与第一上下文类型相关联的第一数据部分。该方法包括使用散列算法从用户行为数据和上下文信息生成第一异构散列码,该第一异构散列码包括表示用户行为数据的第一部分和表示与第一上下文类型相关联的第一数据部分的第二散列码部分。该方法包括访问第二异构散列码,该第二异构散列码包括表示与第一上下文类型相关联的第二数据部分的第三散列码部分。该方法包括比较第一异构散列码和第二异构散列码,包括确定第一异构散列码的第二散列码部分和第二异构散列码的第三散列码部分之间的相似性。
技术领域
本公开一般涉及用户活动建模和相似性搜索。
背景技术
在用于广告和市场营销的大数据系统中,寻找相似用户组并对其进行排名(这被称为最近邻搜索)是一项关键任务,尤其是对于诸如类似搜索(lookalike search)、用户划分(user segmentation)和推荐等的应用。包括电视和移动设备的多种类型的现代设备具有用户与内容的交互历史的详细简档,诸如直播电视、视频点播、游戏、应用和外部设备,这些详细简档可以用于计算用户之间的相似性,并最终计算他们的“最近邻”。然而,由于这种数据的大规模性质(其可能涉及不断更新交互历史的数千万用户,每个用户随时间都跨越数百万个会话),因此这样的任务的计算成本很高。
一种加速最近邻搜索的方法是使用深度神经网络进行散列(hashing)。散列将任意固定格式的数据(诸如图像、声音和文本)转换为固定大小的散列码。然后可以通过比较散列码来执行相似性操作。当生成的散列码是二进制向量(其比较仅是位运算)时,效率增益尤其明显。然而,用户行为历史具有不同于与这种技术兼容的数据格式的上下文特征和模式。
发明内容
附图说明
图1示出了所公开的散列系统的实施例的示例高级结构架构。
图2示出了异构散列模型的示例架构。
图3示出了时间感知注意卷积神经网络的示例架构。
图4A-图4C示出了用于生成和使用异构散列码的系统的示例架构。
图5示出了用于生成和使用异构散列码的系统的示例操作方法。
图6示出了用于生成和使用异构散列码的系统的示例操作方法。
图7示出了异构散列模型的示例架构。
图8示出了可训练门(trainable gate)的示例架构。
图9示出了聚合层的示例架构。
图10示出了异构散列模型的示例架构。
图11示出了示例预处理步骤和网络层。
图12A-图12B示出了由异构散列模型的层执行的示例操作。
图13A-图13B示出了由异构散列模型的层执行的示例操作。
图14示出了异构散列码。
图15示出了示例散列码。
图16示出了示例散列码。
图17示出了应用的散列系统的架构表示。
图18示出了用于训练异构散列模型的示例框架。
图19示出了用于训练和使用时间感知注意卷积神经网络的系统的示例模型。
图20A-图20C示出了时间感知注意卷积神经网络的示例架构。
图21示出了示例用户行为表示。
图22示出了散列系统在各种数据集上的性能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080019076.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于集成装置的光学吸收滤光器
- 下一篇:降混器及降混方法