[发明专利]挖掘用户职业的方法、装置、计算机可读存储介质和终端设备有效

专利信息
申请号: 201810068937.0 申请日: 2018-01-24
公开(公告)号: CN110110213B 公开(公告)日: 2021-03-26
发明(设计)人: 张宗一;梁晨曦;谷皓;凌国惠;张功源 申请(专利权)人: 腾讯科技(深圳)有限公司
主分类号: G06F16/9535 分类号: G06F16/9535;G06K9/62
代理公司: 北京德琦知识产权代理有限公司 11018 代理人: 徐文静;陈世华
地址: 518000 广东省深圳*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 挖掘 用户 职业 方法 装置 计算机 可读 存储 介质 终端设备
【权利要求书】:

1.一种挖掘用户职业的方法,其特征在于,所述方法包括:

提取样本用户的特征值,将所述样本用户的特征值转换为样本用户的特征词;

根据所述样本用户的特征词和所述样本用户的职业标签,训练嵌入向量输出模型,构建已训练嵌入向量输出模型;

将职业标签和所述待挖掘用户的特征词输入所述已训练嵌入向量输出模型,以获取所有职业标签嵌入向量和待挖掘用户的嵌入向量,所述职业标签嵌入向量和所述待挖掘用户的嵌入向量隶属同一向量空间;

将所述待挖掘用户的嵌入向量与所述所有职业标签嵌入向量中的每一个职业标签嵌入向量相匹配,取与所述待挖掘用户的嵌入向量最匹配的职业标签嵌入向量对应的职业标签作为所述待挖掘用户的职业标签。

2.如权利要求1所述的挖掘用户职业的方法,其特征在于,所述使用所述样本用户的特征词和所述样本用户的职业标签训练嵌入向量输出模型,构建已训练嵌入向量输出模型,包括:

初始化所述样本用户的嵌入向量和职业标签嵌入向量;

以所述样本用户的特征词和所述样本用户的职业标签作为样本数据训练所述嵌入向量输出模型,直至损失函数取值最小时训练结束,训练结束时获得的嵌入向量输出模型作为所述已训练嵌入向量输出模型,所述损失函数为衡量所述待挖掘用户的实际职业标签和根据所述已训练嵌入向量输出模型预测出待挖掘用户的职业标签之间差值的函数。

3.如权利要求2所述的挖掘用户职业的方法,其特征在于,所述损失函数为所述a表示样本用户A的特征词,所述b表示所述样本用户A的职业标签,所述表示除所述b之外的职业标签,所述sim(a,b)或所述为余弦相似度计算公式。

4.如权利要求1至3任意一项所述的挖掘用户职业的方法,其特征在于,所述将所述待挖掘用户的嵌入向量与所述所有职业标签嵌入向量中的每一个职业标签嵌入向量相匹配,取与所述待挖掘用户的嵌入向量最匹配的职业标签嵌入向量对应的职业标签作为所述待挖掘用户的职业标签,包括:

计算所述待挖掘用户的嵌入向量与所述所有职业标签嵌入向量中的每一个职业标签嵌入向量的余弦相似度,将所述余弦相似度最大时职业标签嵌入向量对应的职业标签作为所述待挖掘用户的职业标签。

5.一种挖掘用户职业的装置,其特征在于,所述装置包括:

特征转换模块,用于提取样本用户的特征值,将所述样本用户的特征值转换为样本用户的特征词;

嵌入向量获取模块,用于根据所述样本用户的特征词和所述样本用户的职业标签,训练嵌入向量输出模型,构建已训练嵌入向量输出模型;将职业标签和所述待挖掘用户的特征词输入所述已训练嵌入向量输出模型,以获取所有职业标签嵌入向量和待挖掘用户的嵌入向量,所述职业标签嵌入向量和所述待挖掘用户的嵌入向量隶属同一向量空间;

匹配模块,用于将所述待挖掘用户的嵌入向量与所述所有职业标签嵌入向量中的每一个职业标签嵌入向量相匹配,取与所述待挖掘用户的嵌入向量最匹配的职业标签嵌入向量对应的职业标签作为所述待挖掘用户的职业标签。

6.如权利要求5所述的挖掘用户职业的装置,其特征在于,所述模型构建单元包括:

初始化单元,用于初始化所述样本用户的嵌入向量和职业标签嵌入向量;

训练单元,用于以所述样本用户的特征词和所述样本用户的职业标签作为样本数据训练所述嵌入向量输出模型,直至损失函数取值最小时训练结束,训练结束时获得的嵌入向量输出模型作为所述已训练嵌入向量输出模型,所述损失函数为衡量所述待挖掘用户的实际职业标签和根据所述已训练嵌入向量输出模型预测出待挖掘用户的职业标签之间差值的函数。

7.如权利要求6所述的挖掘用户职业的装置,其特征在于,所述损失函数为所述a表示样本用户A的特征词,所述b表示所述样本用户A的职业标签,所述表示除所述b之外的职业标签,所述sim(a,b)或所述为余弦相似度计算公式。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810068937.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top