[发明专利]一种用户画像的构建方法、装置及电子设备有效
申请号: | 201810622106.3 | 申请日: | 2018-06-15 |
公开(公告)号: | CN108810577B | 公开(公告)日: | 2021-02-09 |
发明(设计)人: | 徐佳宏;杜志平;蒋志伟;任俊松;成学文;孙航 | 申请(专利权)人: | 深圳市茁壮网络股份有限公司 |
主分类号: | H04N21/25 | 分类号: | H04N21/25;H04N21/258;H04N21/442;H04N21/466 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 518004 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种用户画像的构建方法、装置及电子设备,通过利用随机算法,从全部节目中抽取出预设数量的节目作为待标记节目,并在接收到对待标记节目进行标签标记后所生成的标记节目组时,基于词向量数据,确定出标记节目组中每个标记节目的相似节目名集合,进而将标记节目的标签作为对应相似节目名集合中每个相似节目的标签,再基于由进行了标签标记的标记节目和相似节目组成的节目查找集合,对用户历史观看节目集合进行标签查找,获得用户画像;可见,基于训练生成的词向量数据,能够将少量标记节目的标签自动扩展为与之相似的每个相似节目的标签,从而实现对大量节目的标签标记,缩减了人工标记的节目数量,进而提高了构建效率。 | ||
搜索关键词: | 一种 用户 画像 构建 方法 装置 电子设备 | ||
【主权项】:
1.一种用户画像的构建方法,其特征在于,包括:获取平台内的全部节目及对应的节目属性;利用随机算法,从获取到的全部所述节目中抽取出预设数量的节目,作为待标记节目;在接收到已进行标签标记的标记节目组时,基于词向量数据,确定出所述标记节目组中每个标记节目的相似节目名集合,所述标记节目是对所述待标记节目进行标签标记后生成的,所述词向量数据是对获取的平台内的全部所述节目及对应的节目属性进行词向量训练所生成的;将每个所述标记节目的标签作为对应的相似节目名集合中每个相似节目的标签,对每个所述相似节目进行标签标记;将进行了标签标记的所述标记节目和所述相似节目作为节目查找集合中的标准节目,并基于所述节目查找集合,对用户历史观看节目集合进行标签查找,获得用户画像。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市茁壮网络股份有限公司,未经深圳市茁壮网络股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810622106.3/,转载请声明来源钻瓜专利网。
- 上一篇:连麦直播的方法、装置及存储介质
- 下一篇:应用于用户终端的广告插播方法及系统