[发明专利]群组推荐方法、存储介质和服务器在审
申请号: | 201711446425.5 | 申请日: | 2017-12-27 |
公开(公告)号: | CN108460073A | 公开(公告)日: | 2018-08-28 |
发明(设计)人: | 蔡圻钊;谭淼清;黄勇;张金芹 | 申请(专利权)人: | 广州市百果园信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q50/00 |
代理公司: | 北京市立方律师事务所 11330 | 代理人: | 刘延喜 |
地址: | 511442 广东省广州市番禺区南村*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 群组 特征向量 存储介质 行为数据 整体特征 映射 向量 服务器 个性化推荐 群组内容 用户访问 用户推荐 精准度 种群 | ||
本发明提供一种群组推荐方法、存储介质和服务器,包括步骤:收集用户访问群组的行为数据;根据所述行为数据,得到所述用户的特征向量;根据同一群组内各用户的特征向量,得到该群组的整体特征向量;计算所述用户的特征向量与各群组的整体特征向量的距离,得到所述用户与群组的距离的映射列表;根据所述映射列表,得到向所述用户推荐的群组列表。该技术方案极大地提升了群组内容的个性化推荐效率与精准度。
技术领域
本发明涉及计算机技术领域,具体而言,本发明涉及一种群组推荐方法、存储介质和服务器。
背景技术
随着互联网技术的快速发展,越来越多的用户选择通过各种内容平台获取信息,而由于目前社会发展形式下,不仅推送信息的内容平台多,各内容平台推荐的信息也因为多而呈现杂乱的现象,致使用户通过各种内容平台获取的常常是海量的信息,并且不断浏览的过程中耗费了大量的时间与精力。由于在上述现象下,用户在内容平台中筛选信息的使用成本过高,容易导致用户的流失。
为解决上述问题,现有技术中,很多内容平台通过大数据、机器学习等,通过获取用户行为数据对其进行“千人千面”的个性化内容推荐。但是,基于群组内容推荐时,此种解决方式仍然停留在用户特征与群组名称或内容的匹配上,针对用户个人而言,该推荐群组的内容仍然过于表层,且无法适应用户个人而形成匹配度高的个性化推荐。
发明内容
本发明提出一种群组推荐方法、存储介质和服务器,用以实现满足用户深层次群组推荐需求的更高效、更精准的个性化推荐。
第一方面,本发明提供一种群组推荐方法,包括步骤:
收集用户访问群组的行为数据;
根据所述行为数据,得到所述用户的特征向量;
根据同一群组内各用户的特征向量,得到该群组的整体特征向量;
计算所述用户的特征向量与各群组的整体特征向量的距离,得到所述用户与群组的距离的映射列表;
根据所述映射列表,得到向所述用户推荐的群组列表。
结合第一方面,本发明第一方面的第一种实施方式中,所述用户访问群组的行为数据包括:用户有效访问群组的群组内容的分词及其频次计数累加值。
结合第一方面的第一种实施方式,本发明第一方面的第二种实施方式中,所述用户有效访问群组为用户访问时长超过预设阈值的群组;所述群组内容包括标题、正文。
结合第一方面的第一种实施方式,本发明第一方面的第三种实施方式中,所述根据所述行为数据,得到所述用户的特征向量,包括步骤:
按预设分类规则,对所述分词进行归类,每个类别对应一个标签;
统计同一标签内,预设时间段内所有分词的频次计数累加值的总和,得到该标签的频次特征向量;
对各标签的频次特征向量进行归一化计算,得到所述用户的特征向量。
结合第一方面,本发明第一方面的第四种实施方式中,所述根据同一群组内各用户的特征向量,得到该群组的整体特征向量,包括步骤:
获取同一群组内各用户的特征向量,将各用户的特征向量相加后除以所述同一群组内的用户数量,得到该群组的整体特征向量。
结合第一方面,本发明第一方面的第五种实施方式中,所述计算所述用户的特征向量与各群组的整体特征向量的距离,包括步骤:
通过向量距离算法,计算所述用户的特征向量与各群组的整体特征向量的距离。
结合第一方面,本发明第一方面的第六种实施方式中,所述根据所述映射列表,得到向所述用户推荐的群组列表,包括步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州市百果园信息技术有限公司,未经广州市百果园信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711446425.5/2.html,转载请声明来源钻瓜专利网。