[发明专利]用户画像的标签生成方法及装置、存储介质、终端有效
申请号: | 202010373398.9 | 申请日: | 2020-05-06 |
公开(公告)号: | CN111651668B | 公开(公告)日: | 2023-06-09 |
发明(设计)人: | 汤奇峰;刘立喆 | 申请(专利权)人: | 上海晶赞融宣科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/951;G06N3/0499;G06N3/08;G06F18/213 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 朱薇蕾;张振军 |
地址: | 200072 上海市静安区灵*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 画像 标签 生成 方法 装置 存储 介质 终端 | ||
一种用户画像的标签生成方法及装置、存储介质、终端,所述方法包括:获取待处理的用户画像;对所述用户画像进行编码处理,以得到原始特征向量,其中,所述原始特征向量为所述用户画像的数字化表示;将所述原始特征向量输入预设嵌入网络模型,其中,所述预设嵌入网络模型用于降低所述原始特征向量的向量维度;接收所述预设嵌入网络模型输出的概率预测结果,其中,所述概率预测结果用于表征所述用户画像与目标标签的关联度;根据所述概率预测结果将所述目标标签确定为所述用户画像的新增标签。通过本发明方案能够有效丰富用户画像的标签数量,且利于提高标签生产的准确度。
技术领域
本发明涉及大数据处理技术领域,具体地涉及一种用户画像的标签生成方法及装置、存储介质、终端。
背景技术
用户画像作为一种勾画目标用户、联系用户诉求与设计方向的有效工具,在各领域得到了广泛的应用。在大数据时代背景下,用户信息充斥在网络中,通过将用户的每个具体信息抽象成标签,利用这些标签将用户形象(即用户画像)具体化,能够为用户提供有针对性的服务。
通常,为了能够很好地将用户形象具体化,需要尽可能多的标签来描述用户形象,往往会有几十个甚至上百个标签来描述一个用户。这些标签不仅数量众多,而且每个标签中的枚举值也各有不同,少则两三个,多则上千个。除了这些大量的标签,用户的行为也是十分重要的描述用户的数据。
虽然在做用户画像的时候,这些数据经过整理能够很好的用于描述人群的画像。但是,在基于用户画像的上层应用中(如推荐,排序,投放等),则由于标签数量众多且具有带有时间性质的行为数据,使得对于画像的建模有一定的困难。导致模型不易拟合或者是画像之间的区分度、关联度不够。
由于用户画像生产的最终目标是尽可能多的丰富用户画像的标签数量以及尽可能正确地生产标签。而模型不易拟合影响标签生产的准确性,画像之间的关联度不够则影响用户画像的标签扩充,均不利于用户画像标签的准确生产。
发明内容
本发明解决的技术问题是如何有效丰富用户画像的标签数量,且利于提高标签生产的准确度。
为解决上述技术问题,本发明实施例提供一种用户画像的标签生成方法,包括:获取待处理的用户画像;对所述用户画像进行编码处理,以得到原始特征向量,其中,所述原始特征向量为所述用户画像的数字化表示;将所述原始特征向量输入预设嵌入网络模型,其中,所述预设嵌入网络模型用于降低所述原始特征向量的向量维度;接收所述预设嵌入网络模型输出的概率预测结果,其中,所述概率预测结果用于表征所述用户画像与目标标签的关联度;根据所述概率预测结果将所述目标标签确定为所述用户画像的新增标签。
可选的,所述标签生成方法还包括:接收所述预设嵌入网络模型输出的处理后特征向量,其中,所述处理后特征向量的长度小于所述原始特征向量的长度。
可选的,所述用户画像包括至少一个已有标签和行为,所述预设嵌入网络模型根据所述用户画像包括的已有标签和行为预测所述用户画像与所述目标标签的关联度。
可选的,所述对所述用户画像进行编码处理,以得到原始特征向量包括:对所述用户画像包括的各已有标签和行为进行独热编码并拼接,以得到所述原始特征向量。
可选的,所述对所述用户画像进行编码处理,以得到原始特征向量还包括:将拼接得到的特征向量记作过渡特征向量;当所述过渡特征向量的长度小于所述预设嵌入网络模型的标准输入长度时,将所述过渡特征向量的长度补齐至所述标准输入长度,以得到所述原始特征向量。
可选的,所述预设嵌入网络模型基于如下步骤训练获得:查找用户画像库中包含所述目标标签的用户画像,以得到原始数据集;将所述原始数据集中的一部分用户画像确定为训练集,剩余部分用户画像确定为测试集;对于所述训练集中的每一用户画像,对所述用户画像进行编码处理,以得到原始特征向量;基于所述训练集中各用户画像对应的原始特征向量训练所述预设嵌入网络模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海晶赞融宣科技有限公司,未经上海晶赞融宣科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010373398.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种冲压头可调式杯突试验机
- 下一篇:一种蔬果识别方法及结算设备和使用方法