[发明专利]计算直播间相似度的方法、存储介质、设备及系统有效
申请号: | 201810023913.3 | 申请日: | 2018-01-10 |
公开(公告)号: | CN108307208B | 公开(公告)日: | 2020-02-07 |
发明(设计)人: | 王璐;张文明;陈少杰 | 申请(专利权)人: | 武汉斗鱼网络科技有限公司 |
主分类号: | H04N21/25 | 分类号: | H04N21/25;H04N21/258 |
代理公司: | 42225 武汉智权专利代理事务所(特殊普通合伙) | 代理人: | 王维 |
地址: | 430000 湖北省武汉市东湖开*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 直播 用户集合 相似度 观看 设备及系统 存储介质 一次观看 热门 用户观看行为 相似性度量 负面影响 时间周期 大数据 统计 | ||
本发明公开了一种计算直播间相似度的方法、存储介质、设备及系统,涉及大数据推荐领域,该方法包括以下步骤:在时间周期内将所有直播间分为热门直播间和非热门直播间。判断用户观看行为是否为有效观看行为,确定每个用户有效观看的直播间的数量。任意选取第一直播间和第二直播间,统计有效观看了第一直播间的第一用户集合以及有效观看了第二直播间的第二用户集合。确定同时有效观看了第一直播间和第二直播间的第三用户集合,获取第三用户集合中的每个用户最后一次观看第一直播间的时间与最后一次观看第二直播间的时间的间隔。计算第一直播间和第二直播间的相似度。本发明能有效降低热门直播间在计算中带来的负面影响,相似性度量较为全面。
技术领域
本发明涉及大数据推荐领域,具体涉及一种计算直播间相似度的方法、存储介质、设备及系统。
背景技术
在大数据的应用领域中,一个重要的方向是根据海量数据对用户进行个性化推荐。在直播平台中,常用的推荐策略是推荐用户看过房间相似的房间,因此需要对直播间的相似度进行度量。此外,在一些基于物品的协同过滤推荐算法中,也需要计算直播间两两之间的相似度。
通常计算物品相似度的算法有以下两种,这些算法被广泛使用,但在直播房间推荐中都存在一些问题。
(1)余弦距离:该算法将每个用户对房间的观看行为作为向量的一个维度,房间之间的相似度采用余弦公式计算,该方法的缺点在于在用户的推荐集中都会出现头部热门主播;抗噪声的能力不强,经常会出现一些错误的度量。
(2)杰卡德系数:该算法是基于集合进行计算的,房间之间的相似度等于同时观看两个房间的用户数除以至少观看了其中一个房间的用户数。该方法的缺点在于仅仅考虑了两个房间的观看用户,未考虑这些用户对其他房间的观看情况,利用的只是部分信息,相似性度量相对而言比较片面。
发明内容
针对现有技术中存在的缺陷,本发明的目的在于提供一种能有效地降低热门直播间在相似度计算中带来的负面影响,且相似性度量较为全面的计算直播间相似度的方法。
为达到以上目的,本发明采取的技术方案是:
一种计算直播间相似度的方法,该方法包括以下步骤:
设定时间周期,并在时间周期内将所有直播间分为热门直播间和非热门直播间;
判断用户观看热门直播间和非热门直播间时是否为有效观看行为,确定每个用户有效观看的直播间的数量;
从所有直播间中任意选取第一直播间和第二直播间,统计有效观看了第一直播间的第一用户集合以及有效观看了第二直播间的第二用户集合;
确定同时有效观看了第一直播间和第二直播间的第三用户集合,获取第三用户集合中的每个用户最后一次观看第一直播间的时间与最后一次观看第二直播间的时间的间隔;以及
根据获取的第一用户集合和第二用户集合中的每个用户有效观看的直播间的数量,以及获取的第三用户集合中的每个用户最后一次观看第一直播间的时间与最后一次观看第二直播间的时间的间隔,计算第一直播间和第二直播间的相似度。
在上述技术方案的基础上,
统计有效观看了第一直播间的第一用户集合Ui和有效观看了第二直播间的第二用户集合Uj;
确定同时有效观看了第一直播间和第二直播间的第三用户集合Ui∩Uj;
获取第一用户集合和第二用户集合中的每个用户有效观看的直播间的数量qu;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉斗鱼网络科技有限公司,未经武汉斗鱼网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810023913.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种视频推送方法及装置
- 下一篇:一种个性化程度高的视频推荐系统