[发明专利]用户画像的标签生成方法及装置、存储介质、终端有效
申请号: | 202010373398.9 | 申请日: | 2020-05-06 |
公开(公告)号: | CN111651668B | 公开(公告)日: | 2023-06-09 |
发明(设计)人: | 汤奇峰;刘立喆 | 申请(专利权)人: | 上海晶赞融宣科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/951;G06N3/0499;G06N3/08;G06F18/213 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 朱薇蕾;张振军 |
地址: | 200072 上海市静安区灵*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 画像 标签 生成 方法 装置 存储 介质 终端 | ||
1.一种用户画像的标签生成方法,其特征在于,包括:
获取待处理的用户画像;
对所述用户画像进行编码处理,以得到原始特征向量,其中,所述原始特征向量为所述用户画像的数字化表示;
将所述原始特征向量输入预设嵌入网络模型,其中,所述预设嵌入网络模型用于降低所述原始特征向量的向量维度;
接收所述预设嵌入网络模型输出的概率预测结果,其中,所述概率预测结果用于表征所述用户画像与目标标签的关联度;
根据所述概率预测结果将所述目标标签确定为所述用户画像的新增标签。
2.根据权利要求1所述的标签生成方法,其特征在于,还包括:
接收所述预设嵌入网络模型输出的处理后特征向量,其中,所述处理后特征向量的长度小于所述原始特征向量的长度。
3.根据权利要求1所述的标签生成方法,其特征在于,所述用户画像包括至少一个已有标签和行为,所述预设嵌入网络模型根据所述用户画像包括的已有标签和行为预测所述用户画像与所述目标标签的关联度。
4.根据权利要求3所述的标签生成方法,其特征在于,所述对所述用户画像进行编码处理,以得到原始特征向量包括:
对所述用户画像包括的各已有标签和行为进行独热编码并拼接,以得到所述原始特征向量。
5.根据权利要求4所述的标签生成方法,其特征在于,所述对所述用户画像进行编码处理,以得到原始特征向量还包括:
将拼接得到的特征向量记作过渡特征向量;
当所述过渡特征向量的长度小于所述预设嵌入网络模型的标准输入长度时,将所述过渡特征向量的长度补齐至所述标准输入长度,以得到所述原始特征向量。
6.根据权利要求1所述的标签生成方法,其特征在于,所述预设嵌入网络模型基于如下步骤训练获得:
查找用户画像库中包含所述目标标签的用户画像,以得到原始数据集;
将所述原始数据集中的一部分用户画像确定为训练集,剩余部分用户画像确定为测试集;
对于所述训练集中的每一用户画像,对所述用户画像进行编码处理,以得到原始特征向量;
基于所述训练集中各用户画像对应的原始特征向量训练所述预设嵌入网络模型。
7.根据权利要求6所述的标签生成方法,其特征在于,所述预设嵌入网络模型还基于如下步骤训练获得:
对于所述测试集中的每一用户画像,对所述用户画像进行编码处理,以得到原始特征向量;
将所述测试集中各用户画像对应的原始特征向量输入训练得到的所述预设嵌入网络模型,并根据所述预设嵌入网络模型的输出结果调整所述预设嵌入网络模型的参数和权重,直至所述预设嵌入网络模型的输出结果表明所述预设嵌入网络模型的准确率高于预设基准值。
8.根据权利要求1所述的标签生成方法,其特征在于,所述预设嵌入网络模型包括:
嵌入层,所述嵌入层的输入为所述原始特征向量;
至少一层全连接层,所述至少一层全连接层中第一层全连接层的输入为所述嵌入层的输出,自所述至少一层全连接层中的第二层全连接层起,每一层全连接层的输入为上一层全连接层的输出,所述至少一层全连接层中最后一层全连接层的输出为所述预设嵌入网络模型的输出。
9.根据权利要求8所述的标签生成方法,其特征在于,所述至少一层全连接层的数量为两层。
10.根据权利要求8所述的标签生成方法,其特征在于,对于所述预设嵌入网络模型中的每一层,所述层输出的特征向量的长度小于所述特征向量输入所述层时的长度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海晶赞融宣科技有限公司,未经上海晶赞融宣科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010373398.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种冲压头可调式杯突试验机
- 下一篇:一种蔬果识别方法及结算设备和使用方法